講演名 2005/6/17
SN比に頑健なマルチミクスチャーHMMの性能評価(耐雑音, 音源分離, ロボット)
鈴木 基之, 加藤 裕介, 伊藤 彰則, 牧野 正三,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 音声認識システムの実用化に向けて, 雑音対策は大きな課題のひとつである。様々な雑音環境下でも高精度な認識を可能とするため, 雑音重畳マルチミクスチャーモデルを提案した。このモデルは, 単一の雑音を重畳させた音声を用いて学習したHMMを複数集め, 対応する状態の出力分布を混合分布としてひとつにまとめることで構築される。本報告では, 様々なSN比に対しても同様に対処することで, 複数雑音, 複数SN比に対応した雑音重畳マルチミクスチャーモデルを構築し, その性能を評価した。その結果, 既知, 未知いずれのSN比においても, マルチコンディションモデルに比べて高い認識性能を示した。また, このモデルに対して分布数の削減を行ったところ, 分布数を25%程度まで削減しても, 認識率は1ポイント程度の低下にとどまっていることがわかった。
抄録(英) Background noise is one of the biggest problem for speech recognition systems in real environments. In order to achieve high recognition performance for corrupted speech, we proposed a new construction method of HMMs dealing with various kinds of background noise. At first, each HMM dealing with a single noise is trained for each background noise, and then all Gaussian components of those HMMs are combined into a "multi-mixture HMM". From the experimental results, the multi-mixture HMM gave the highest recognition performance for any kind of noise and any variation of SNR. Although the multi-mixture HMMs has high performance, it has a huge number of Gaussian components that makes the speech recognition slower. In order to solve the problem, we also proposed a reduction method of Gaussian components. It can decrease the number of Gaussian components with slight deterioration of recognition performance.
キーワード(和) 不特定雑音用音響モデル / マルチミクスチャーHMM / 雑音下音声認識
キーワード(英) noise-independent Acousitc model / multi-mixture HMMs / speech recognition under background noises
資料番号 SP2005-31
発行日

研究会情報
研究会 SP
開催期間 2005/6/17(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) SN比に頑健なマルチミクスチャーHMMの性能評価(耐雑音, 音源分離, ロボット)
サブタイトル(和)
タイトル(英) Performance evaluation for the multi-mixture HMMs in various kinds of noise with various SNRs conditions
サブタイトル(和)
キーワード(1)(和/英) 不特定雑音用音響モデル / noise-independent Acousitc model
キーワード(2)(和/英) マルチミクスチャーHMM / multi-mixture HMMs
キーワード(3)(和/英) 雑音下音声認識 / speech recognition under background noises
第 1 著者 氏名(和/英) 鈴木 基之 / Motoyuki SUZUKI
第 1 著者 所属(和/英) 東北大学大学院工学研究科
Graduate School of Engineering, Tohoku University
第 2 著者 氏名(和/英) 加藤 裕介 / Yusuke KATO
第 2 著者 所属(和/英) 東北大学大学院工学研究科
Graduate School of Engineering, Tohoku University
第 3 著者 氏名(和/英) 伊藤 彰則 / Akinori ITO
第 3 著者 所属(和/英) 東北大学大学院工学研究科
Graduate School of Engineering, Tohoku University
第 4 著者 氏名(和/英) 牧野 正三 / Shozo MAKINO
第 4 著者 所属(和/英) 東北大学大学院工学研究科
Graduate School of Engineering, Tohoku University
発表年月日 2005/6/17
資料番号 SP2005-31
巻番号(vol) vol.105
号番号(no) 133
ページ範囲 pp.-
ページ数 6
発行日