講演名 2010-05-26
残響指標RSR-D_nに基づく残響環境下音声認識の予測性能評価(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
福森 隆寛, 森勢 将雅, 西浦 敬信,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 近年,雑音および残響下における音声認識手法に関する研究が盛んに行われている.それに伴い雑音環境下で音声認識性能を頑健に予測可能な指標も多数提案されている.一方,残響環境下における音声認識性能の有力な予測指標は提案されておらず,残響下音声認識性能の頑健な予測指標の策定は急務である.これまでに残響下音声認識性能の優劣を判別する残響指標として残響時間が提案されているが,仮定音場と実環境との差異から残響時間だけでなく他の残響特性も変化するため,音声認識性能を予測する残響量の指標として不十分であることが問題視されている.そこで本研究では,ISO3382 Annex Aで説明されている室内音響指標を用いた残響下における頑健な音声認識性能の予測法を提案する.提案法では初期反射音と後続残響音の関係を表す室内音響指標の中でも特にDefinition(D値)に着目し,事前に様々な環境で複数箇所計測したインパルス応答を基に算出したD値と音声認識性能に基づき回帰分析を行うことで残響指標RSR-D_nを策定する.策定した残響指標RSR-D_nと性能予測を行う残響環境の発話位置におけるインパルス応答を基に残響下音声認識性能の予測を試みる.評価実験の結果,従来の残響時間に基づく手法と比較して残響指標RSR-D_nは,より頑健に残響下音声認識性能を予測できることを確認した.
抄録(英) As no common reverberation criteria for the recognition of reverberant-speech have been proposed, it has been difficult to estimate this. We thus proposed new reverberation criteria, RSR-D_n, (Reverberant Speech Recognition criteria with D_n) based on IS03382 acoustic parameters. We first designed the suitable reverberation criteria with the relation between IS03382 Annex A acoustic parameters and speech recognition performance. We then estimated the speech recognition performance based on our designed reverberation criteria, RSR-D_n. As a result of evaluation experiments, we could confirm that the recognition performance could be accurately and robustly estimated with proposed RSR-D_n.
キーワード(和) 残響下音声認識 / 性能予測 / 室内音響指標 / 残響時間 / 残響指標
キーワード(英) Reverberant speech recognition / Performance estimation / Acoustic parameters / Reverberation time
資料番号 EA2010-3,SIP2010-3,SP2010-3
発行日

研究会情報
研究会 SIP
開催期間 2010/5/19(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Signal Processing (SIP)
本文の言語 JPN
タイトル(和) 残響指標RSR-D_nに基づく残響環境下音声認識の予測性能評価(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
サブタイトル(和)
タイトル(英) An Evaluation of the performance estimation of reverberant speech recognition with reverberant criteria, RSR-D_n
サブタイトル(和)
キーワード(1)(和/英) 残響下音声認識 / Reverberant speech recognition
キーワード(2)(和/英) 性能予測 / Performance estimation
キーワード(3)(和/英) 室内音響指標 / Acoustic parameters
キーワード(4)(和/英) 残響時間 / Reverberation time
キーワード(5)(和/英) 残響指標
第 1 著者 氏名(和/英) 福森 隆寛 / Takahiro FUKUMORI
第 1 著者 所属(和/英) 立命館大学大学院理工学研究科
Graduate School of Scinence and Engineering, Ritsumeikan University
第 2 著者 氏名(和/英) 森勢 将雅 / Masanori MORISE
第 2 著者 所属(和/英) 立命館大学情報理工学部
College of Information and Science, Ritsumeikan University
第 3 著者 氏名(和/英) 西浦 敬信 / Takanobu NISHIURA
第 3 著者 所属(和/英) 立命館大学情報理工学部
College of Information and Science, Ritsumeikan University
発表年月日 2010-05-26
資料番号 EA2010-3,SIP2010-3,SP2010-3
巻番号(vol) vol.110
号番号(no) 55
ページ範囲 pp.-
ページ数 6
発行日