講演名 2010-09-03
マルチコンディションHMMを用いた残響ロバスト音声認識の検討(知的マルチメディアシステム,一般)
片山 恵輔, 宮永 喜一,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 雑音と残響のある環境で音声認識を行うと,認識率は低下する事が知られている.本稿では,人工残響インパルス応答をクリーン音声に畳み込み生成した残響音声を,クリーン音声と共に学習に用いた雑音と残響環境に頑健な音声認識システムを検討する.先ず,クリーン音声の他に残響音声の内1種類を選択して作成したマルチコンディションHMMによる音声認識実験を行い,各残響環境での認識率を評価する.その結果を基に,マルチコンディションHMMを複数の残響音声を用いて作成することが,多くの残響環境に有効であることを示す.また,実環境においてマイクロホンで観測される信号は雑音の影響も受けるため,元の音声の特徴が歪んでしまう.そのため,残響に加えて雑音を考慮したマルチコンディション学習を行い,雑音と残響のある環境での音声認識を検討する.
抄録(英) Using a speech recognition system in reverberant and noisy environment, the recognition rate is seriously declined. In this paper, we study the reverberation and noise robust speech recognition system by multi-condition training. This method uses a clean speech data with reverberant speech data generated from clean speech data and artificial reverberant impulse response. First, we evaluate the recognition rate of the speech recognition experiment in each reverberant environments using the multi-condition HMM made of a clean speech data and one reverberant speech data. Based on this results, we show that the multi-condition training using plural reverberant speech data is effective in various reverberant environments. An observed signal is distorted because of noise influences in real environment. Therefore, we evaluate the multi-condition training that considers reverberant and noisy environment.
キーワード(和) 音声認識 / マルチコンディション学習 / 残響ロバスト / 雑音環境
キーワード(英) speech recognition / multi-condition training / reverberation robust / noisy environment
資料番号 SIS2010-30
発行日

研究会情報
研究会 SIS
開催期間 2010/8/26(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Smart Info-Media Systems (SIS)
本文の言語 JPN
タイトル(和) マルチコンディションHMMを用いた残響ロバスト音声認識の検討(知的マルチメディアシステム,一般)
サブタイトル(和)
タイトル(英) A Study of Reverberation Robust Speech Recognition Using Multi-Condition HMM
サブタイトル(和)
キーワード(1)(和/英) 音声認識 / speech recognition
キーワード(2)(和/英) マルチコンディション学習 / multi-condition training
キーワード(3)(和/英) 残響ロバスト / reverberation robust
キーワード(4)(和/英) 雑音環境 / noisy environment
第 1 著者 氏名(和/英) 片山 恵輔 / Keisuke KATAYAMA
第 1 著者 所属(和/英) 北海道大学大学院情報科学研究科
Graduate School of Information Science and Technology, Hokkaido University
第 2 著者 氏名(和/英) 宮永 喜一 / Yoshikazu MIYANAGA
第 2 著者 所属(和/英) 北海道大学大学院情報科学研究科
Graduate School of Information Science and Technology, Hokkaido University
発表年月日 2010-09-03
資料番号 SIS2010-30
巻番号(vol) vol.110
号番号(no) 189
ページ範囲 pp.-
ページ数 6
発行日