講演名 2004/12/14
二段雑音スペクトルの推定と回帰による車内音声認識(ポスターセッション)(第6回音声言語シンポジウム)
李 衛鋒, 伊藤 克亘I, 武田 一哉, 板倉 文忠,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 走行中の車内のような騒々しい環境においても,精度の高い音声認識技術が望まれている.本稿では,二段雑音スペクトルの推定という手法を提案され,一つの遠隔マイクロホンで収録した音声データを基に,非線形回帰を行うことで,車内での音声認識精度の向上を目指した.12車内走行条件の音声認識実験によっで,もとの遠隔マイクロホンに比べて相対ワード認識誤りを65%の程度で減少できる結果が得られた.
抄録(英) In this paper, we present a two-stage noise spectra estimation approach. After the first-stage noise estimation using the improved minima controlled recursive averaging (IMCRA) method, the second-stage noise estimation is performed by employing a maximum a posteriori (MAP) noise amplitude estimator. We also develop a regression-based speech enhance system by approximating the clean speech with the estimated noise and original noisy speech. Evaluation experiments show that the proposed two-stage noise estimation method results in lower estimation error for all test noise types. Compared to original noisy speech, the proposed regression-based approach obtains an average relative word error rate (WER) reduction of 65% in our isolated word recognition experiments conducted in 12 real car environments.
キーワード(和) 非線形回帰 / 多層パーセプトロン / 音声強調 / 音声認識
キーワード(英) maximum a posteriori (MAP) estimation / spectral subtraction / speech enhancement / multi-layer perceptron / speech recognition
資料番号 NLC2004-77,SP2004-117
発行日

研究会情報
研究会 SP
開催期間 2004/12/14(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 ENG
タイトル(和) 二段雑音スペクトルの推定と回帰による車内音声認識(ポスターセッション)(第6回音声言語シンポジウム)
サブタイトル(和)
タイトル(英) Two-stage Noise Spectra Estimation and Regression based In-car Speech Recognition using Single Distant Microphone
サブタイトル(和)
キーワード(1)(和/英) 非線形回帰 / maximum a posteriori (MAP) estimation
キーワード(2)(和/英) 多層パーセプトロン / spectral subtraction
キーワード(3)(和/英) 音声強調 / speech enhancement
キーワード(4)(和/英) 音声認識 / multi-layer perceptron
第 1 著者 氏名(和/英) 李 衛鋒 / Weifeng LI
第 1 著者 所属(和/英) 名古屋大学工学研究科
Graduate School of Engineering, Nagoya University
第 2 著者 氏名(和/英) 伊藤 克亘I / Katunobu ITOU
第 2 著者 所属(和/英) 名古屋大学情報科学研究科
Graduate School of Information Science, Nagoya University
第 3 著者 氏名(和/英) 武田 一哉 / Kazuya TAKEDA
第 3 著者 所属(和/英) 名古屋大学情報科学研究科
Graduate School of Information Science, Nagoya University
第 4 著者 氏名(和/英) 板倉 文忠 / Fumitada ITAKURA
第 4 著者 所属(和/英) 名城大学情報工学科
Faculty of Science and Technology, Meijo University, Meijo University
発表年月日 2004/12/14
資料番号 NLC2004-77,SP2004-117
巻番号(vol) vol.104
号番号(no) 542
ページ範囲 pp.-
ページ数 6
発行日