講演名 2020-01-17
収録済み多重音に対する音源分離手法の検討
錠前 聡(日本工大), 大田 健紘(日本工大), 吉野 秀明(日本工大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 収録済み楽曲に含まれる楽器多重音の基本周波数解析や和音解析の精度を向上させるために,多重音を単音に分離することは有用である.先行研究にてガンマプロセス非負値行列因子分解の学習過程に対して,Deep Neural Networkの分類に基づいた基底強調を行い,分離精度向上を目指した.しかし,評価に用いた音源によっては若干の精度の向上があったが,顕著な向上は確認できなかった.分離途中の基底数や誤差の変化を分析することで,精度が向上しなかった原因を明らかにした.
抄録(英) It is useful to separate multiple sounds into single sounds in order to improve the accuracy of fundamental frequency analysis and chord analysis of multiple sounds included in recorded music. In previous research, we applied the basis enhancement based on Deep Neural Network classification to the learning process of gamma process non-negative matrix factorization in order to improve separation accuracy. However, there was a slight improvement in accuracy depending on the sound source used in the evaluation, but no significant improvement was confirmed. The reason why the accuracy was not improved was clarified by analyzing changes in the number of bases and errors during separation.
キーワード(和) 音源分離 / 非負値行列因子分解 / DNN / 機械学習
キーワード(英) Sound source separation / non-negative matrix factorization / DNN / machine learning
資料番号 CQ2019-131
発行日 2020-01-09 (CQ)

研究会情報
研究会 CQ
開催期間 2020/1/16(から2日開催)
開催地(和) NHK放送技術研究所
開催地(英) NHK Science & Technology Research Laboratories
テーマ(和) AR/VR、放送サービス、映像/音声サービスの品質、高臨場感、ユーザ行動/心理、ユーザ体験、メディア品質、ネットワークの品質・QoS制御、災害時のネットワークとコミュニケーション、機械学習、一般
テーマ(英) AR/VR, Broadcasting Service, Video/Voice Services Quality, High Realistic, User Behavior/Psychology, User Experience, Media Quality, Network Quality and QoS Control, Networks and Communications at Disaster, User Behavior, Machine Learning, etc.
委員長氏名(和) 下西 英之(NEC)
委員長氏名(英) Hideyuki Shimonishi(NEC)
副委員長氏名(和) 岡本 淳(NTT) / 平栗 健史(日本工大)
副委員長氏名(英) Jun Okamoto(NTT) / Takefumi Hiraguri(Nippon Inst. of Tech.)
幹事氏名(和) 大田 健紘(日本工大) / 木村 共孝(同志社大) / 山中 広明(NICT)
幹事氏名(英) Kenko Ota(Nippon Inst. of Tech.) / Tomotaka Kimura(Doshisha Univ.) / Hiroaki Yamanaka(NICT)
幹事補佐氏名(和) 佐々木 力(KDDI総合研究所) / 西川 由明(NEC) / 木村 拓人(NTT)
幹事補佐氏名(英) Chikara Sasaki(KDDI Research) / Yoshiaki Nishikawa(NEC) / Takuto Kimura(NTT)

講演論文情報詳細
申込み研究会 Technical Committee on Communication Quality
本文の言語 JPN
タイトル(和) 収録済み多重音に対する音源分離手法の検討
サブタイトル(和)
タイトル(英) A study sound source separation method for recorded multiple sounds
サブタイトル(和)
キーワード(1)(和/英) 音源分離 / Sound source separation
キーワード(2)(和/英) 非負値行列因子分解 / non-negative matrix factorization
キーワード(3)(和/英) DNN / DNN
キーワード(4)(和/英) 機械学習 / machine learning
第 1 著者 氏名(和/英) 錠前 聡 / Satoru Jomae
第 1 著者 所属(和/英) 日本工業大学(略称:日本工大)
Nippon Institute of Technology(略称:NIT)
第 2 著者 氏名(和/英) 大田 健紘 / Kenko Ota
第 2 著者 所属(和/英) 日本工業大学(略称:日本工大)
Nippon Institute of Technology(略称:NIT)
第 3 著者 氏名(和/英) 吉野 秀明 / Hideaki Yoshino
第 3 著者 所属(和/英) 日本工業大学(略称:日本工大)
Nippon Institute of Technology(略称:NIT)
発表年月日 2020-01-17
資料番号 CQ2019-131
巻番号(vol) vol.119
号番号(no) CQ-367
ページ範囲 pp.137-140(CQ),
ページ数 4
発行日 2020-01-09 (CQ)