電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
技報オンライン
‥‥ (ESS/通ソ/エレソ/ISS)
技報アーカイブ
‥‥ (エレソ/通ソ)
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2019-12-13 13:00
多チャンネル変分自己符号化器法による任意話者の音源分離
李 莉筑波大)・亀岡弘和NTT)・井上翔太牧野昭二筑波大EA2019-77
抄録 (和) 多チャンネル変分自己符号化器(MVAE)は,各音源のスペクトログラムの生成過程を条件付変分自己符号化器(CVAE)を用いてモデル化した混合信号のモデルであり,これを用いたパーミュテーションフリーかつ高精度な音源分離手法であるMVAE法,およびその計算コストを大幅に削減したFastMVAE法が提案されている.MVAE法とFastMVAE法は教師あり音源分離法に位置づけられるが,本稿では,十分なデータでネットワークを学習させることによりいずれの手法も任意話者に対する音源分離を既知話者の場合と同等の性能で行えることを示す.また,Product-of-Expertsに基づいて潜在空間変数の事前確率を考慮した推論アルゴリズムを提案する.話者依存及び任意話者の音源分離実験において提案法の高い分離性能を確認した. 
(英) The multichannel variational autoencoder method (MVAE) is a recently proposed determined source separation method, which uses a conditional variational autoencoder (CVAE) to learn the spectrograms of source signals given a source-class ID as an auxiliary input. The trained decoder distribution can be used as a universal generative model capable of generating spectrograms of all the sources involved in the training samples. The decoder distribution can then be exploited to estimate the spectrograms of sources in a mixture. The MVAE methods, including the original MVAE method and its fast version called FastMVAE, were shown to significantly outperform conventional methods under speaker-dependent conditions, where the target speakers are seen in the training dataset. In this paper, we investigate the performances of the two MVAE methods under speaker-independent conditions. To further enhance the ability of FastMVAE to estimate the latent space variables for unknown speakers, we propose a prior-aware inference algorithm based on the concept of product-of-experts. Experimental results revealed that the MVAE methods could perform well even under speaker-independent conditions.
キーワード (和) 多チャンネル音源分離 / 話者分離 / 多チャネル変分自己符号化器(MVAE)法 / FastMVAE法 / 条件付き変分自己符号化器 (CVAE) / / /  
(英) Multichannel source separation / determined source separation / multichannel variational autoencoder (MVAE), / FastMVAE / conditional variational autoencoder (CVAE) / / /  
文献情報 信学技報, vol. 119, no. 334, EA2019-77, pp. 79-84, 2019年12月.
資料番号 EA2019-77 
発行日 2019-12-05 (EA) 
ISSN Print edition: ISSN 0913-5685  Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード EA2019-77

研究会情報
研究会 EA  
開催期間 2019-12-12 - 2019-12-13 
開催地(和) 九州工業大学戸畑キャンパス(北九州市) 
開催地(英) Kyushu Inst. Tech. 
テーマ(和) 応用/電気音響,一般 
テーマ(英) Engineering/Electro Acoustics, and Related Topics 
講演論文情報の詳細
申込み研究会 EA 
会議コード 2019-12-EA 
本文の言語 日本語 
タイトル(和) 多チャンネル変分自己符号化器法による任意話者の音源分離 
サブタイトル(和)  
タイトル(英) Speaker-independent source separation with multichannel variational autoencoder 
サブタイトル(英)  
キーワード(1)(和/英) 多チャンネル音源分離 / Multichannel source separation  
キーワード(2)(和/英) 話者分離 / determined source separation  
キーワード(3)(和/英) 多チャネル変分自己符号化器(MVAE)法 / multichannel variational autoencoder (MVAE),  
キーワード(4)(和/英) FastMVAE法 / FastMVAE  
キーワード(5)(和/英) 条件付き変分自己符号化器 (CVAE) / conditional variational autoencoder (CVAE)  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 李 莉 / Li Li / リィ リィ
第1著者 所属(和/英) 筑波大学 (略称: 筑波大)
University of Tsukuba (略称: Univ. Tsukuba)
第2著者 氏名(和/英/ヨミ) 亀岡 弘和 / Hirokazu Kameoka / カメオカ ヒロカズ
第2著者 所属(和/英) NTT (略称: NTT)
NTT (略称: NTT)
第3著者 氏名(和/英/ヨミ) 井上 翔太 / Shota Inoue / イノウエ ショウタ
第3著者 所属(和/英) 筑波大学 (略称: 筑波大)
University of Tsukuba (略称: Univ. Tsukuba)
第4著者 氏名(和/英/ヨミ) 牧野 昭二 / Shoji Makino / マキノ ショウジ
第4著者 所属(和/英) 筑波大学 (略称: 筑波大)
University of Tsukuba (略称: Univ. Tsukuba)
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者
発表日時 2019-12-13 13:00:00 
発表時間 25 
申込先研究会 EA 
資料番号 IEICE-EA2019-77 
巻番号(vol) IEICE-119 
号番号(no) no.334 
ページ範囲 pp.79-84 
ページ数 IEICE-6 
発行日 IEICE-EA-2019-12-05 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会