講演名 2011-05-12
雑音モデルの頑健なオンライン推定法に基づく雑音抑圧の検討(オーガナイズドセッション:スピーチエンハンスメント,音声・音響信号処理,音声及び一般)
藤本 雅清, 中谷 智広, 渡部 晋治,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本研究では,多峰的な分布に従う非定常雑音のモデルをオンライン推定して雑音抑圧に利用することにより,強い非定常性を持つ雑音環境下での音声認識性能が大幅に改善することを示す.従来のVector Taylor series(VTS)等に代表される雑音抑圧法では,雑音のモデルに単一性のガウス分布を適用していたが,実世界で観測される雑音の多くは多峰的な分布に従っているため,雑音のモデル化が十分でなかった.提案手法では,雑音信号を観測信号から最小平均二乗誤差(MMSE: Minimum mean squared error)推定し,得られた雑音信号を学習データとして利用することにより,多峰的な分布を持つ雑音のオンラインでのモデル化を容易にした.提案手法により,従来のVTS法に比べて最大12%の音声認識性能を改善することができた.
抄録(英) In this paper, we propose a robust on-line estimation method of noise mixture model for the statistical model-based noise suppression. The conventional techniques, e.g., vector Taylor series (VTS)-based approaches, employ a single Gaussian distribution for the noise model. However, it is insufficient for non-stationary noises which have a multi-peak distribution. Therefore, we investigate a way of estimating the noise mixture model by using a minimum mean squared error (MMSE) estimate of the noise. By using the MMSE estimate of the noise, the proposed method makes it easy to estimate noise mixture model which well matches to multi-peak distribution of the noise. The proposed method significantly outperformed the VTS-based approach, and the maximum improvement in the word error rate was about 12%.
キーワード(和) 雑音抑圧 / 雑音モデル推定 / MMSE推定 / 音声認識
キーワード(英) noise suppression / noise model estimation / MMSE estimation / speech recognition
資料番号 EA2011-2,SIP2011-2,SP2011-2
発行日

研究会情報
研究会 EA
開催期間 2011/5/5(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Engineering Acoustics (EA)
本文の言語 JPN
タイトル(和) 雑音モデルの頑健なオンライン推定法に基づく雑音抑圧の検討(オーガナイズドセッション:スピーチエンハンスメント,音声・音響信号処理,音声及び一般)
サブタイトル(和)
タイトル(英) A Robust On-line Estimation Method of Noise Mixture Model for Noise Suppression
サブタイトル(和)
キーワード(1)(和/英) 雑音抑圧 / noise suppression
キーワード(2)(和/英) 雑音モデル推定 / noise model estimation
キーワード(3)(和/英) MMSE推定 / MMSE estimation
キーワード(4)(和/英) 音声認識 / speech recognition
第 1 著者 氏名(和/英) 藤本 雅清 / Masakiyo FUJIMOTO
第 1 著者 所属(和/英) 日本電信電話(株)NTTコミュニケーション科学基礎研究所
NTT Communication Science Laboratories, NTT Corporation
第 2 著者 氏名(和/英) 中谷 智広 / Tomohiro NAKATANI
第 2 著者 所属(和/英) 日本電信電話(株)NTTコミュニケーション科学基礎研究所
NTT Communication Science Laboratories, NTT Corporation
第 3 著者 氏名(和/英) 渡部 晋治 / Shinji WATANABE
第 3 著者 所属(和/英) 日本電信電話(株)NTTコミュニケーション科学基礎研究所
NTT Communication Science Laboratories, NTT Corporation
発表年月日 2011-05-12
資料番号 EA2011-2,SIP2011-2,SP2011-2
巻番号(vol) vol.111
号番号(no) 26
ページ範囲 pp.-
ページ数 6
発行日