講演名 2011-12-19
非負値行列分解を用いた楽曲中のボーカルパート抽出に関する検討(ポスターセッション,第13回音声言語シンポジウム)
安井 優太, 坂野 秀樹, 板倉 文忠,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本研究では,歌声信号と伴奏信号を重ね合わせた楽曲信号から非負値行列分解を用いて歌声信号を抽出する方法について検討する.非負値行列分解は,入力スペクトログラムに対し,スペクトログラム上に現れる類似したスペクトルパターンを一つの基底ベクトルとして表現することで,複数の基底ベクトルと,それぞれの時間変化情報に分離することができる.しかし,歌声に現れるビブラートなどスペクトルが時間的に変動する信号に対しては有限個の基底で表現することが困難なため,歌声の抽出に適していない.この問題を解決するために,楽曲信号中の歌声信号の基本周波数を基準となる音高に一致させることで基本周波数によるスペクトルの変動を除去し,この信号に対して非負値行列分解を行う手法を提案する.抽出された歌声信号と伴奏信号をS劔比により評価した結果,従来法に比べ提案法は合成信号の劣化が表れ,S/N比は低くなる傾向があったが,一部の楽曲信号で有効性が確認された.
抄録(英) This paper describes extraction methods of vocal signal in music signal which is a mixture of vocal signal and accompaniment signal by using non-negative matrix factorization. Non-negative matrix factorization (NMF) can factorize an input spectrogram into a finite number of basis vectors and its temporal activity information, because it represents similar spectral patterns appeared on the input spectrogram with a single basis vector. However, NMF is not suitable for extraction of vocal signal because factorization of vocal signal including temporal spectral fluctuation appeared in vibrato of singing voice into a finite number of basis vectors is quite difficult. To solve this problem, we propose a preprocessing method that removes the spectral fluctuation by using a linear frequency axis warping of the spectrum so that a fundamental frequency of vocal signal included in the input music signal aligns to a reference frequency. Then, NMF is applied to this preprocessed signal. We have performed evaluation by SNR of extracted vocal signal and extracted accompaniment signal, in comparison with the conventional method. As a result, it was found that the generated signals by the proposed method had lower quality and SNR. However, the proposed method obtained slight better results for some music signals.
キーワード(和) 非負値行列分解 / 音源分離 / 音楽音響信号 / ビブラート
キーワード(英) Non-negative Matrix Factorization / Sound Source Separation / Music Signal / Vibrato
資料番号 NLC2011-43,SP2011-88
発行日

研究会情報
研究会 NLC
開催期間 2011/12/12(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 JPN
タイトル(和) 非負値行列分解を用いた楽曲中のボーカルパート抽出に関する検討(ポスターセッション,第13回音声言語シンポジウム)
サブタイトル(和)
タイトル(英) Study on extraction of vocal part in music signal by using non-negative matrix factorization
サブタイトル(和)
キーワード(1)(和/英) 非負値行列分解 / Non-negative Matrix Factorization
キーワード(2)(和/英) 音源分離 / Sound Source Separation
キーワード(3)(和/英) 音楽音響信号 / Music Signal
キーワード(4)(和/英) ビブラート / Vibrato
第 1 著者 氏名(和/英) 安井 優太 / Yuta YASUI
第 1 著者 所属(和/英) 名城大学大学院理工学研究科
Graduate School of Science and Technology, Meijo University
第 2 著者 氏名(和/英) 坂野 秀樹 / Hideki BANNO
第 2 著者 所属(和/英) 名城大学理工学部
Meijo University
第 3 著者 氏名(和/英) 板倉 文忠 / Fumitada ITAKURA
第 3 著者 所属(和/英) 名城大学理工学部
Meijo University
発表年月日 2011-12-19
資料番号 NLC2011-43,SP2011-88
巻番号(vol) vol.111
号番号(no) 364
ページ範囲 pp.-
ページ数 6
発行日