講演名 2008/5/22
複数残響特性下の音声を単一モデル学習に用いた未知残響環境に頑健な音声認識の検討(福祉と音声処理,一般)
西亀 健太, 渡部 晋治, 西本 卓也, 小野 順貴, 嵯峨山 茂樹,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 残響環境下では音声認識性能は著しく著しく劣化する.これに対し,人工残響インパルス応答をクリーン音声に畳み込んで学習することで,認識率が向上することが知られている.しかし,どのような残響インパルス応答を畳み込んで学習すべきか,という点に関しては十分に議論がなされていない.本研究では,人工残響インパルス応答の残響時間パラメータと認識率の関係を残響音声認識評価基盤(CENSREC-4)を用いて詳細に調べ,認識率が大きく変わる残響時間パラメータの範囲がテスト環境より短い残響時間に分布していることを述べる.また,その範囲に基づいて人工残響インパルス応答を選択しマルチコンディション学習を行うことが,未知残響環境に対して頑健な音声認識であることを示す.
抄録(英) In reverberant environment, speech recognition accuracy is seriously degraded. An effective method is to train acoustic models using reverberant speech which are generated from clean speech data and reverberant impulse response. It is not clear, however, what kind of impulse response is suitable for environmental variations. In this research, we show the range of reverberant time that changes speech recognition accuracy drastically through evaluation with CENSREC-4. Then we point out that the range of reverberant time which is effective for model training is shorter than that of test conditions. We also show the multi-condition training is effective for speech recognition under unknown environments using speech data of the range of reverberant time we showed.
キーワード(和) 残響環境 / 音声認識 / モデル学習 / 人工残響 / インパルス応答 / 残響時間
キーワード(英) reverberant environment / speech recognition / model construction / artificial reverberance / impulse response / reverberation time
資料番号 SP2008-8,WIT2008-8
発行日

研究会情報
研究会 WIT
開催期間 2008/5/22(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Well-being Information Technology(WIT)
本文の言語 JPN
タイトル(和) 複数残響特性下の音声を単一モデル学習に用いた未知残響環境に頑健な音声認識の検討(福祉と音声処理,一般)
サブタイトル(和)
タイトル(英) A Study on Robust Speech Recognition against Unknown Reverberation Using Single Speech Model Trained under Multiple Reverberant Environments
サブタイトル(和)
キーワード(1)(和/英) 残響環境 / reverberant environment
キーワード(2)(和/英) 音声認識 / speech recognition
キーワード(3)(和/英) モデル学習 / model construction
キーワード(4)(和/英) 人工残響 / artificial reverberance
キーワード(5)(和/英) インパルス応答 / impulse response
キーワード(6)(和/英) 残響時間 / reverberation time
第 1 著者 氏名(和/英) 西亀 健太 / Kenta NISHIKI
第 1 著者 所属(和/英) 東京大学情報理工学系研究科システム情報学専攻
Department of Information Physics and Computing, University of Tokyo
第 2 著者 氏名(和/英) 渡部 晋治 / Shinji WATANABE
第 2 著者 所属(和/英) 日本電信電話(株)NTTコミュニケーション科学基礎研究所
NTT Communication Science Laboratories
第 3 著者 氏名(和/英) 西本 卓也 / Takuya NISHIMOTO
第 3 著者 所属(和/英) 東京大学情報理工学系研究科システム情報学専攻
Department of Information Physics and Computing, University of Tokyo
第 4 著者 氏名(和/英) 小野 順貴 / Nobutaka ONO
第 4 著者 所属(和/英) 東京大学情報理工学系研究科システム情報学専攻
Department of Information Physics and Computing, University of Tokyo
第 5 著者 氏名(和/英) 嵯峨山 茂樹 / Shigeki SAGAYAMA
第 5 著者 所属(和/英) 東京大学情報理工学系研究科システム情報学専攻
Department of Information Physics and Computing, University of Tokyo
発表年月日 2008/5/22
資料番号 SP2008-8,WIT2008-8
巻番号(vol) vol.108
号番号(no) 67
ページ範囲 pp.-
ページ数 6
発行日