講演抄録/キーワード |
講演名 |
2019-12-13 13:00
多チャンネル変分自己符号化器法による任意話者の音源分離 ○李 莉(筑波大)・亀岡弘和(NTT)・井上翔太・牧野昭二(筑波大) EA2019-77 |
抄録 |
(和) |
多チャンネル変分自己符号化器(MVAE)は,各音源のスペクトログラムの生成過程を条件付変分自己符号化器(CVAE)を用いてモデル化した混合信号のモデルであり,これを用いたパーミュテーションフリーかつ高精度な音源分離手法であるMVAE法,およびその計算コストを大幅に削減したFastMVAE法が提案されている.MVAE法とFastMVAE法は教師あり音源分離法に位置づけられるが,本稿では,十分なデータでネットワークを学習させることによりいずれの手法も任意話者に対する音源分離を既知話者の場合と同等の性能で行えることを示す.また,Product-of-Expertsに基づいて潜在空間変数の事前確率を考慮した推論アルゴリズムを提案する.話者依存及び任意話者の音源分離実験において提案法の高い分離性能を確認した. |
(英) |
The multichannel variational autoencoder method (MVAE) is a recently proposed determined source separation method, which uses a conditional variational autoencoder (CVAE) to learn the spectrograms of source signals given a source-class ID as an auxiliary input. The trained decoder distribution can be used as a universal generative model capable of generating spectrograms of all the sources involved in the training samples. The decoder distribution can then be exploited to estimate the spectrograms of sources in a mixture. The MVAE methods, including the original MVAE method and its fast version called FastMVAE, were shown to significantly outperform conventional methods under speaker-dependent conditions, where the target speakers are seen in the training dataset. In this paper, we investigate the performances of the two MVAE methods under speaker-independent conditions. To further enhance the ability of FastMVAE to estimate the latent space variables for unknown speakers, we propose a prior-aware inference algorithm based on the concept of product-of-experts. Experimental results revealed that the MVAE methods could perform well even under speaker-independent conditions. |
キーワード |
(和) |
多チャンネル音源分離 / 話者分離 / 多チャネル変分自己符号化器(MVAE)法 / FastMVAE法 / 条件付き変分自己符号化器 (CVAE) / / / |
(英) |
Multichannel source separation / determined source separation / multichannel variational autoencoder (MVAE), / FastMVAE / conditional variational autoencoder (CVAE) / / / |
文献情報 |
信学技報, vol. 119, no. 334, EA2019-77, pp. 79-84, 2019年12月. |
資料番号 |
EA2019-77 |
発行日 |
2019-12-05 (EA) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
EA2019-77 |