講演名 2012-05-25
残響下音声認識における発話様式の実験的分析と評価(オーガナイズドセッション:スピーチエンハンスメント,音声・音響信号処理,音声及び一般)
福森 隆寛, 中山 雅人, 森勢 将雅, 西浦 敬信, 山下 洋一,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 近年,音声認識技術の発展に伴って,ハンズフリー音声インターフェースが爆発的に普及している.残響環境下においてマイクロホンから離れて発話すると残響混入の影響により音声認識性能が著しく低下する問題がある.これに対して事前に音声認識システムの性能予測を行い,予測結果に基づいて音声認識システムの前処理に反映することで音声認識性能向上が期待できる.たとえば残響に頑健あるいは脆弱な話者を特定できれば,事前に各話者に適切な音響モデルを選択できる.そこで本研究では,残響下音声認識の性能向上を目指して音声認識性能の話者依存性について調査した.具体的には,多種の発話内容が収録されているCSRC連続音声データベースと残響環境のインパルス応答を用いて連続音素認識評価を行い,発話内容・発話様式と音声認識性能の関係を実験的に分析した.発話内容と音声認識性能の関係を評価した結果,明瞭に発声しやすい文章(天気予報文章など)は,残響の有無に関係なく音声認識性能が高いことを確認した.一方,発話様式と残響下音声認識性能の関係を評価した結果,両者間に顕著な傾向が確認できなかったことから,残響が発話様式に与える影響は小さいことがわかった.
抄録(英) In recent years, a hands-free speech device has been developed with improving speech recognition techniques. The reverberant speech degrades the recognition performance in the field of distant-talking speech recognition. It is possibly addressed by taking preventive measures against the degradation of recognition performance by estimating the recognition performance. Identification of the speaker with robust or weak features against reverberation makes it possible to adapt acoustic model for each speaker toward improving the recognition performance. In this research, we investigated the speaker-dependence in the reverberant speech recognition toward improving recognition performance. We conducted the recognition experiments with CSRC continuous speech database in various conditions to evaluate the effect of reverberation on speaking-style. As a result of reverberant speech recognition experiment in each speaking-style, we could confirm the lower effects of reverberation on speaking-style since there was no clear tendency between reverberation and speech recognition performance.
キーワード(和) 残響下音声認識 / 発話様式 / 話者依存性 / 性能予測 / CSRC連続音声データベース
キーワード(英) Reverberant speech recognition / Speaking-style / Speaker-dependence / Estimation of recognition performance / CSRC continuous speech database
資料番号 EA2012-31,SIP2012-31,SP2012-31
発行日

研究会情報
研究会 EA
開催期間 2012/5/17(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Engineering Acoustics (EA)
本文の言語 JPN
タイトル(和) 残響下音声認識における発話様式の実験的分析と評価(オーガナイズドセッション:スピーチエンハンスメント,音声・音響信号処理,音声及び一般)
サブタイトル(和)
タイトル(英) Evaluation and analysis of speaking-style in reverberant speech recognition performance
サブタイトル(和)
キーワード(1)(和/英) 残響下音声認識 / Reverberant speech recognition
キーワード(2)(和/英) 発話様式 / Speaking-style
キーワード(3)(和/英) 話者依存性 / Speaker-dependence
キーワード(4)(和/英) 性能予測 / Estimation of recognition performance
キーワード(5)(和/英) CSRC連続音声データベース / CSRC continuous speech database
第 1 著者 氏名(和/英) 福森 隆寛 / Takahiro FUKUMORI
第 1 著者 所属(和/英) 立命館大学大学院情報理工学研究科
Graduate School of Information Science and Engineering, Ritsumeikan University
第 2 著者 氏名(和/英) 中山 雅人 / Masato NAKAYAMA
第 2 著者 所属(和/英) 立命館大学情報理工学部
College of Information and Science, Ritsumeikan University
第 3 著者 氏名(和/英) 森勢 将雅 / Masanori MORISE
第 3 著者 所属(和/英) 立命館大学情報理工学部
College of Information and Science, Ritsumeikan University
第 4 著者 氏名(和/英) 西浦 敬信 / Takanobu NISHIURA
第 4 著者 所属(和/英) 立命館大学情報理工学部
College of Information and Science, Ritsumeikan University
第 5 著者 氏名(和/英) 山下 洋一 / Yoichi YAMASHITA
第 5 著者 所属(和/英) 立命館大学情報理工学部
College of Information and Science, Ritsumeikan University
発表年月日 2012-05-25
資料番号 EA2012-31,SIP2012-31,SP2012-31
巻番号(vol) vol.112
号番号(no) 47
ページ範囲 pp.-
ページ数 6
発行日