講演名 | 2020-01-17 収録済み多重音に対する音源分離手法の検討 錠前 聡(日本工大), 大田 健紘(日本工大), 吉野 秀明(日本工大), |
---|---|
PDFダウンロードページ | ![]() |
抄録(和) | 収録済み楽曲に含まれる楽器多重音の基本周波数解析や和音解析の精度を向上させるために,多重音を単音に分離することは有用である.先行研究にてガンマプロセス非負値行列因子分解の学習過程に対して,Deep Neural Networkの分類に基づいた基底強調を行い,分離精度向上を目指した.しかし,評価に用いた音源によっては若干の精度の向上があったが,顕著な向上は確認できなかった.分離途中の基底数や誤差の変化を分析することで,精度が向上しなかった原因を明らかにした. |
抄録(英) | It is useful to separate multiple sounds into single sounds in order to improve the accuracy of fundamental frequency analysis and chord analysis of multiple sounds included in recorded music. In previous research, we applied the basis enhancement based on Deep Neural Network classification to the learning process of gamma process non-negative matrix factorization in order to improve separation accuracy. However, there was a slight improvement in accuracy depending on the sound source used in the evaluation, but no significant improvement was confirmed. The reason why the accuracy was not improved was clarified by analyzing changes in the number of bases and errors during separation. |
キーワード(和) | 音源分離 / 非負値行列因子分解 / DNN / 機械学習 |
キーワード(英) | Sound source separation / non-negative matrix factorization / DNN / machine learning |
資料番号 | CQ2019-131 |
発行日 | 2020-01-09 (CQ) |
研究会情報 | |
研究会 | CQ |
---|---|
開催期間 | 2020/1/16(から2日開催) |
開催地(和) | NHK放送技術研究所 |
開催地(英) | NHK Science & Technology Research Laboratories |
テーマ(和) | AR/VR、放送サービス、映像/音声サービスの品質、高臨場感、ユーザ行動/心理、ユーザ体験、メディア品質、ネットワークの品質・QoS制御、災害時のネットワークとコミュニケーション、機械学習、一般 |
テーマ(英) | AR/VR, Broadcasting Service, Video/Voice Services Quality, High Realistic, User Behavior/Psychology, User Experience, Media Quality, Network Quality and QoS Control, Networks and Communications at Disaster, User Behavior, Machine Learning, etc. |
委員長氏名(和) | 下西 英之(NEC) |
委員長氏名(英) | Hideyuki Shimonishi(NEC) |
副委員長氏名(和) | 岡本 淳(NTT) / 平栗 健史(日本工大) |
副委員長氏名(英) | Jun Okamoto(NTT) / Takefumi Hiraguri(Nippon Inst. of Tech.) |
幹事氏名(和) | 大田 健紘(日本工大) / 木村 共孝(同志社大) / 山中 広明(NICT) |
幹事氏名(英) | Kenko Ota(Nippon Inst. of Tech.) / Tomotaka Kimura(Doshisha Univ.) / Hiroaki Yamanaka(NICT) |
幹事補佐氏名(和) | 佐々木 力(KDDI総合研究所) / 西川 由明(NEC) / 木村 拓人(NTT) |
幹事補佐氏名(英) | Chikara Sasaki(KDDI Research) / Yoshiaki Nishikawa(NEC) / Takuto Kimura(NTT) |
講演論文情報詳細 | |
申込み研究会 | Technical Committee on Communication Quality |
---|---|
本文の言語 | JPN |
タイトル(和) | 収録済み多重音に対する音源分離手法の検討 |
サブタイトル(和) | |
タイトル(英) | A study sound source separation method for recorded multiple sounds |
サブタイトル(和) | |
キーワード(1)(和/英) | 音源分離 / Sound source separation |
キーワード(2)(和/英) | 非負値行列因子分解 / non-negative matrix factorization |
キーワード(3)(和/英) | DNN / DNN |
キーワード(4)(和/英) | 機械学習 / machine learning |
第 1 著者 氏名(和/英) | 錠前 聡 / Satoru Jomae |
第 1 著者 所属(和/英) | 日本工業大学(略称:日本工大) Nippon Institute of Technology(略称:NIT) |
第 2 著者 氏名(和/英) | 大田 健紘 / Kenko Ota |
第 2 著者 所属(和/英) | 日本工業大学(略称:日本工大) Nippon Institute of Technology(略称:NIT) |
第 3 著者 氏名(和/英) | 吉野 秀明 / Hideaki Yoshino |
第 3 著者 所属(和/英) | 日本工業大学(略称:日本工大) Nippon Institute of Technology(略称:NIT) |
発表年月日 | 2020-01-17 |
資料番号 | CQ2019-131 |
巻番号(vol) | vol.119 |
号番号(no) | CQ-367 |
ページ範囲 | pp.137-140(CQ), |
ページ数 | 4 |
発行日 | 2020-01-09 (CQ) |