収録済み多重音に対する音源分離手法の検討

錠前 聡; 大田 健紘; 吉野 秀明

講演名	2020-01-17 収録済み多重音に対する音源分離手法の検討錠前聡(日本工大), 大田健紘(日本工大), 吉野秀明(日本工大),
PDFダウンロードページ	PDFダウンロードページへ
抄録(和)	収録済み楽曲に含まれる楽器多重音の基本周波数解析や和音解析の精度を向上させるために，多重音を単音に分離することは有用である．先行研究にてガンマプロセス非負値行列因子分解の学習過程に対して，Deep Neural Networkの分類に基づいた基底強調を行い，分離精度向上を目指した．しかし，評価に用いた音源によっては若干の精度の向上があったが，顕著な向上は確認できなかった．分離途中の基底数や誤差の変化を分析することで，精度が向上しなかった原因を明らかにした．
抄録(英)	It is useful to separate multiple sounds into single sounds in order to improve the accuracy of fundamental frequency analysis and chord analysis of multiple sounds included in recorded music. In previous research, we applied the basis enhancement based on Deep Neural Network classification to the learning process of gamma process non-negative matrix factorization in order to improve separation accuracy. However, there was a slight improvement in accuracy depending on the sound source used in the evaluation, but no significant improvement was confirmed. The reason why the accuracy was not improved was clarified by analyzing changes in the number of bases and errors during separation.
キーワード(和)	音源分離 / 非負値行列因子分解 / DNN / 機械学習
キーワード(英)	Sound source separation / non-negative matrix factorization / DNN / machine learning
資料番号	CQ2019-131
発行日	2020-01-09 (CQ)

研究会情報
研究会	CQ
開催期間	2020/1/16(から2日開催)
開催地（和）	NHK放送技術研究所
開催地（英）	NHK Science & Technology Research Laboratories
テーマ（和）	AR/VR、放送サービス、映像/音声サービスの品質、高臨場感、ユーザ行動/心理、ユーザ体験、メディア品質、ネットワークの品質・ＱｏＳ制御、災害時のネットワークとコミュニケーション、機械学習、一般
テーマ（英）	AR/VR, Broadcasting Service, Video/Voice Services Quality, High Realistic, User Behavior/Psychology, User Experience, Media Quality, Network Quality and QoS Control, Networks and Communications at Disaster, User Behavior, Machine Learning, etc.
委員長氏名（和）	下西英之(NEC)
委員長氏名（英）	Hideyuki Shimonishi(NEC)
副委員長氏名（和）	岡本淳(NTT) / 平栗健史(日本工大)
副委員長氏名（英）	Jun Okamoto(NTT) / Takefumi Hiraguri(Nippon Inst. of Tech.)
幹事氏名（和）	大田健紘(日本工大) / 木村共孝(同志社大) / 山中広明(NICT)
幹事氏名（英）	Kenko Ota(Nippon Inst. of Tech.) / Tomotaka Kimura(Doshisha Univ.) / Hiroaki Yamanaka(NICT)
幹事補佐氏名（和）	佐々木力(KDDI総合研究所) / 西川由明(NEC) / 木村拓人(NTT)
幹事補佐氏名（英）	Chikara Sasaki(KDDI Research) / Yoshiaki Nishikawa(NEC) / Takuto Kimura(NTT)

講演論文情報詳細
申込み研究会	Technical Committee on Communication Quality
本文の言語	JPN
タイトル（和）	収録済み多重音に対する音源分離手法の検討
サブタイトル（和）
タイトル（英）	A study sound source separation method for recorded multiple sounds
サブタイトル（和）
キーワード(1)（和/英）	音源分離 / Sound source separation
キーワード(2)（和/英）	非負値行列因子分解 / non-negative matrix factorization
キーワード(3)（和/英）	DNN / DNN
キーワード(4)（和/英）	機械学習 / machine learning
第 1 著者氏名（和/英）	錠前聡 / Satoru Jomae
第 1 著者所属（和/英）	日本工業大学(略称：日本工大) Nippon Institute of Technology(略称：NIT)
第 2 著者氏名（和/英）	大田健紘 / Kenko Ota
第 2 著者所属（和/英）	日本工業大学(略称：日本工大) Nippon Institute of Technology(略称：NIT)
第 3 著者氏名（和/英）	吉野秀明 / Hideaki Yoshino
第 3 著者所属（和/英）	日本工業大学(略称：日本工大) Nippon Institute of Technology(略称：NIT)
発表年月日	2020-01-17
資料番号	CQ2019-131
巻番号（vol）	vol.119
号番号（no）	CQ-367
ページ範囲	pp.137-140(CQ),
ページ数	4
発行日	2020-01-09 (CQ)