講演名 2005/7/15
パワートラジェクトリー上での残響のモデル化と遠隔音声認識への適用(聴覚・音声及び一般)
竹居 翼, 松本 弘, 山本 一公,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 遠隔音声認識で問題となる残響の影響を低減するため, MFCC分析におけるメルBPF出力パワートラジェクトリー上での残響のモデル化を検討している.この残響モデルは, 残響を表す指数的減衰係数, 直接音対残響音比, 初期反射によるカラーリング含むチャンネルゲインの3つのパラメータから成り立っている.モデルパラメータは, 残響有り無しの一対の学習音声を用いて対数パワートラジェクトリー上での誤差最小基準により推定される.指定パラメータを用いて残響パワートラジェクトリーを合成し, それから得られるMFCCを用いてHMMを学習した結果, 実残響音声で学習したHMMによる認識精度との差は数%以内であった.更に, このモデルに基づく逆フィルタとフロアリング及び平滑化の後処理より, 日本語数字音声の認識において単語正解精度を最大12
抄録(英) In order to reduce the influence of reverberation in distance speech recogintion, this paper examines a reverberation model on the power trajectory domain at the output of a mel-filter in the MFCC analysis. The model parameters consist of the decay rate representing reverberation, the ratio of reverberant power to the direct sound, and the frequency response of the channel including some parts of coloration. These model parameters are estimated for each frequency band based on a minimum mean square error of log-power trajectory using pairs of clean speech and their reverberant counterparts. HMMs trained by MFCC derived from synthesized power trajectory with the estimated parameters attained a few percet lower recognition accuracy than that obtaind by actual reverberant HMMs. Furthermore, the dereververation by an inverse filter based on the model and post- processing by flooring and smoothing improved the recognition accuracy by about 10% in Acc. compared to non-processed speech.
キーワード(和) 残響音声 / 残響除去 / 遠隔音声認識 / パワートラジェクトリー / ハンズフリー音声認識
キーワード(英) Reverberation / Dereverberation / Distant speech recognition / Power trajectory / Hands-free speech recognition
資料番号 SP2005-43
発行日

研究会情報
研究会 SP
開催期間 2005/7/15(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) パワートラジェクトリー上での残響のモデル化と遠隔音声認識への適用(聴覚・音声及び一般)
サブタイトル(和)
タイトル(英) Reverberation modeling on power spectral trajectory for distant speech recognition
サブタイトル(和)
キーワード(1)(和/英) 残響音声 / Reverberation
キーワード(2)(和/英) 残響除去 / Dereverberation
キーワード(3)(和/英) 遠隔音声認識 / Distant speech recognition
キーワード(4)(和/英) パワートラジェクトリー / Power trajectory
キーワード(5)(和/英) ハンズフリー音声認識 / Hands-free speech recognition
第 1 著者 氏名(和/英) 竹居 翼 / Tasuku TAKEI
第 1 著者 所属(和/英) 信州大学工学部
Faculuty of Engineering, Shinshu University
第 2 著者 氏名(和/英) 松本 弘 / Hiroshi MATSUMOTO
第 2 著者 所属(和/英) 信州大学工学部
Faculuty of Engineering, Shinshu University
第 3 著者 氏名(和/英) 山本 一公 / Kazumasa YAMAMOTO
第 3 著者 所属(和/英) 信州大学工学部
Faculuty of Engineering, Shinshu University
発表年月日 2005/7/15
資料番号 SP2005-43
巻番号(vol) vol.105
号番号(no) 199
ページ範囲 pp.-
ページ数 5
発行日