講演名 2013-05-16
雑音・残響指標NRSR-PD_nに基づく雑音・残響下音声認識の予測性能評価(スピーチエンハンスメント,電気音響,信号処理,音声一般)
福森 隆寛, 中山 雅人, 西浦 敬信, 山下 洋一,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 実環境において音声認識システムを利用すると,雑音や残響などの外乱の影響を受けて音声認識性能が著しく劣化する.ここで外乱による性能劣化を事前に予測できれば,その結果に基づいて性能改善手法を前処理等に反映できる.これまでに雑音下ではPerceputual Evaluation of Speech Quality(PESQ)を,残響下では室内音響指標(D値)を用いて音声認識性能を予測する手法が提案されている.しかし,これらの手法には予測指標が表現できない外乱が混入すると音声認識性能の予測精度は著しく劣化する問題がある.そこで本研究では,PESQとD値を併用して雑音・残響下における頑健な音声認識性能の予測法を提案する.提案法では事前に計測した発話音声やインパルス応答を用いて算出したPESQ,D値,音声認識性能から雑音・残響指標Noisy and Reverberant Speech Recognition criteria with PESQ and D_n(NRSR-PD_n)を策定する.そしてNRSR-PD_nを用いて性能予測を行う発話位置におけるインパルス応答と発話音声から音声認識性能の予測を試みる.評価実験の結果,従来のPESQとD値を個別に用いて性能予測する手法よりもNRSR-PD_nは頑健に雑音・残響下音声認識性能を予測できることを確認した.
抄録(英) The noisy and reverberant speech degrades the recognition performance in the field of distant-talking speech recognition. It is possibly addressed by taking preventive methods against the degradation of recognition performance with the criteria for recognition performance estimation. We thus proposed new noisy and reverberation criteria, NRSR-PD_n (Noisy and Reverberant Speech Recognition criteria with PESQ and D_n) for recognition performance estimation. We first designed NRSR-PD_n with the relation among ISO3382 Annex A acoustic parameters, PESQ and speech recognition performance. We then estimated speech recognition performance based on our designed reverberation criteria, NRSR-PD_n. In evaluation experiments, we could confirm that the noisy and reverberant recognition performance could be accurately and robustly estimated with NRSR-PD_n.
キーワード(和) 雑音・残響下音声認識 / 性能予測 / PESQ / 室内音響指標
キーワード(英) Noisy and reverberant speech recognition / Performance estimation / PESQ / Acoustic parameters
資料番号 EA2013-6,SIP2013-6,SP2013-6
発行日

研究会情報
研究会 SP
開催期間 2013/5/9(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) 雑音・残響指標NRSR-PD_nに基づく雑音・残響下音声認識の予測性能評価(スピーチエンハンスメント,電気音響,信号処理,音声一般)
サブタイトル(和)
タイトル(英) An evaluation of the performance estimation of noisy and reverberant speech recognition with noisy and reverberant criteria NRSR-PD_n
サブタイトル(和)
キーワード(1)(和/英) 雑音・残響下音声認識 / Noisy and reverberant speech recognition
キーワード(2)(和/英) 性能予測 / Performance estimation
キーワード(3)(和/英) PESQ / PESQ
キーワード(4)(和/英) 室内音響指標 / Acoustic parameters
第 1 著者 氏名(和/英) 福森 隆寛 / Takahiro FUKUMORI
第 1 著者 所属(和/英) 立命館大学大学院情報理工学研究科
Graduate School of Information Science and Engineering, Ritsumeikan University
第 2 著者 氏名(和/英) 中山 雅人 / Masato NAKAYAMA
第 2 著者 所属(和/英) 立命館大学情報理工学部
College of Information Science and Engineering, Ritsumeikan University
第 3 著者 氏名(和/英) 西浦 敬信 / Takanobu NISHIURA
第 3 著者 所属(和/英) 立命館大学情報理工学部
College of Information Science and Engineering, Ritsumeikan University
第 4 著者 氏名(和/英) 山下 洋一 / Yoichi YAMASHITA
第 4 著者 所属(和/英) 立命館大学情報理工学部
College of Information Science and Engineering, Ritsumeikan University
発表年月日 2013-05-16
資料番号 EA2013-6,SIP2013-6,SP2013-6
巻番号(vol) vol.113
号番号(no) 29
ページ範囲 pp.-
ページ数 6
発行日