講演名 2010-12-20
雑音のバイアス-残差成分の分解と各成分の最適化に基づく雑音抑圧の検討(音響モデル・雑音・分析,第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
藤本 雅清, 渡部 晋治, 中谷 智広,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本研究では,雑音のバイアス-残差成分の分解に基づく非定常雑音の推定法を提案し,推定された雑音を用いて雑音抑圧を行うことにより雑音環境下での音声認識性能が改善することを示す.非定常雑音を時間不変のバイアス成分と時間変動を伴う残差成分に分解することにより,各々の役割が明確になり,各成分に対して適切なパラメータ推定法を適用することができる.本研究ではバイアス成分を観測信号の時系列とEMアルゴリズムにより推定し,残差成分をAuto-regressive (AR)過程に基づく並列非線形カルマンフィルタにより推定する.また,AR過程の初期パラメータにより雑音抑圧性能,及び音声認識性能が変化するため,複数の音声認識の中間表現Confusion networkを統合して単語誤りを最小化する,Minimum-time frame word errorによる評価についても述べる.
抄録(英) In this paper, we propose a non-stationary noise estimation method based on bias-residual component decomposition, and show that the proposed method improved speech recognition accuracy compared with the noise estimation methods without component decomposition. The proposed decomposition method clarifies the role of each component, thus enabling us to apply a suitable parameter estimation technique to each component. In this paper, the bias component is estimated by the EM algorithm with the entire observed signal sequence. On the other hand, the residual component is sequentially estimated by multiplying the extended Kalman filter with the auto-regressive process. In addition, the proposed noise estimation. As further improvement, we also evaluate the speech recognition by using a minimum-time frame word error. It minimizes word error rate by combining various hypotheses given by multiple parameter settings of the proposed noise estimation.
キーワード(和) 音声認識 / 雑音抑圧 / 非定常雑音 / 成分分解
キーワード(英) speech recognition / noise suppression / non-stationary noise / component decomposition
資料番号 NLC2010-18,SP2010-91
発行日

研究会情報
研究会 SP
開催期間 2010/12/13(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) 雑音のバイアス-残差成分の分解と各成分の最適化に基づく雑音抑圧の検討(音響モデル・雑音・分析,第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
サブタイトル(和)
タイトル(英) Noise suppression method based on bias-residual component decomposition and optimization
サブタイトル(和)
キーワード(1)(和/英) 音声認識 / speech recognition
キーワード(2)(和/英) 雑音抑圧 / noise suppression
キーワード(3)(和/英) 非定常雑音 / non-stationary noise
キーワード(4)(和/英) 成分分解 / component decomposition
第 1 著者 氏名(和/英) 藤本 雅清 / Masakiyo FUJIMOTO
第 1 著者 所属(和/英) 日本電信電話(株)NTTコミュニケーション科学基礎研究所
NTT Communication Science Laboratories, NTT Corporation
第 2 著者 氏名(和/英) 渡部 晋治 / Shinji WATANABE
第 2 著者 所属(和/英) 日本電信電話(株)NTTコミュニケーション科学基礎研究所
NTT Communication Science Laboratories, NTT Corporation
第 3 著者 氏名(和/英) 中谷 智広 / Tomohiro NAKATANI
第 3 著者 所属(和/英) 日本電信電話(株)NTTコミュニケーション科学基礎研究所
NTT Communication Science Laboratories, NTT Corporation
発表年月日 2010-12-20
資料番号 NLC2010-18,SP2010-91
巻番号(vol) vol.110
号番号(no) 357
ページ範囲 pp.-
ページ数 6
発行日