講演抄録/キーワード |
講演名 |
2012-12-14 10:40
対数スペクトル事前分布を用いたMAPスペクトル推定に基づく劣決定音源分離 ○岩田康明(名大)・中谷智広・藤本雅清・吉岡拓也(NTT)・齋藤洋典(名大) EA2012-114 |
抄録 |
(和) |
音声信号を非定常ガウス過程でモデル化し,最尤法に基づきスペクトル推定を行うアプローチは,多くの音声強調手法で用いられている.我々はこれまでに,このアプローチの推定精度を改善するために,学習済みの対数スペクトル事前分布を導入し,事後確率最大化(MAP)スペクトル推定に拡張する方法を提案してきた.本稿ではこの拡張を,Duongらが提案したマルチチャネルウィーナフィルタに基づく劣決定音源分離法に適用する.従来法では最尤法に基づき音源スペクトルと空間相関行列を推定することで音源分離を実現していたのに対し,提案法ではその音源スペクトルの推定の部分をMAPスペクトル推定に拡張する.これにより,高精度なスペクトル推定を行うことで,分離精度の改善を目指す.実験では,提案法により分離精度が改善することを示す. |
(英) |
Assuming speech to be non-stationary Gaussian process, maximum likelihood spectral estimation has been studied as an effective speech enhancement approach. Recently, to improve the estimation accuracy of this approach, we have proposed an extention of it, namely a maximum a posterior (MAP) estimation approach using pre-trained log-spectral priors, and showed its effectiveness. This paper newly applies this extention to a multi-channel Wiener filtering based undetermined blind source separation (BSS) technique proposed by Duong et al. This conventional method adopts the likelihood maximization approach for estimating the source spectra and the spatial correlation matrices for the Wiener filtering. The proposed method extends it by introducing the MAP estimation approach for estimating the source spectra, and improves the accuracy of the Wiener filtering. |
キーワード |
(和) |
ブラインド音源分離 / 対数パワースペクトル / 事後確率最大化推定 / 混合ガウス分布 / / / / |
(英) |
blind source separation / log-power spectrum / maximum a posteriori estimation / Gaussian mixture model / / / / |
文献情報 |
信学技報, vol. 112, no. 347, EA2012-114, pp. 29-34, 2012年12月. |
資料番号 |
EA2012-114 |
発行日 |
2012-12-06 (EA) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
EA2012-114 |