講演名 | 2004/12/14 二段雑音スペクトルの推定と回帰による車内音声認識(ポスターセッション)(第6回音声言語シンポジウム) 李 衛鋒, 伊藤 克亘I, 武田 一哉, 板倉 文忠, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 走行中の車内のような騒々しい環境においても,精度の高い音声認識技術が望まれている.本稿では,二段雑音スペクトルの推定という手法を提案され,一つの遠隔マイクロホンで収録した音声データを基に,非線形回帰を行うことで,車内での音声認識精度の向上を目指した.12車内走行条件の音声認識実験によっで,もとの遠隔マイクロホンに比べて相対ワード認識誤りを65%の程度で減少できる結果が得られた. |
抄録(英) | In this paper, we present a two-stage noise spectra estimation approach. After the first-stage noise estimation using the improved minima controlled recursive averaging (IMCRA) method, the second-stage noise estimation is performed by employing a maximum a posteriori (MAP) noise amplitude estimator. We also develop a regression-based speech enhance system by approximating the clean speech with the estimated noise and original noisy speech. Evaluation experiments show that the proposed two-stage noise estimation method results in lower estimation error for all test noise types. Compared to original noisy speech, the proposed regression-based approach obtains an average relative word error rate (WER) reduction of 65% in our isolated word recognition experiments conducted in 12 real car environments. |
キーワード(和) | 非線形回帰 / 多層パーセプトロン / 音声強調 / 音声認識 |
キーワード(英) | maximum a posteriori (MAP) estimation / spectral subtraction / speech enhancement / multi-layer perceptron / speech recognition |
資料番号 | NLC2004-77,SP2004-117 |
発行日 |
研究会情報 | |
研究会 | SP |
---|---|
開催期間 | 2004/12/14(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Speech (SP) |
---|---|
本文の言語 | ENG |
タイトル(和) | 二段雑音スペクトルの推定と回帰による車内音声認識(ポスターセッション)(第6回音声言語シンポジウム) |
サブタイトル(和) | |
タイトル(英) | Two-stage Noise Spectra Estimation and Regression based In-car Speech Recognition using Single Distant Microphone |
サブタイトル(和) | |
キーワード(1)(和/英) | 非線形回帰 / maximum a posteriori (MAP) estimation |
キーワード(2)(和/英) | 多層パーセプトロン / spectral subtraction |
キーワード(3)(和/英) | 音声強調 / speech enhancement |
キーワード(4)(和/英) | 音声認識 / multi-layer perceptron |
第 1 著者 氏名(和/英) | 李 衛鋒 / Weifeng LI |
第 1 著者 所属(和/英) | 名古屋大学工学研究科 Graduate School of Engineering, Nagoya University |
第 2 著者 氏名(和/英) | 伊藤 克亘I / Katunobu ITOU |
第 2 著者 所属(和/英) | 名古屋大学情報科学研究科 Graduate School of Information Science, Nagoya University |
第 3 著者 氏名(和/英) | 武田 一哉 / Kazuya TAKEDA |
第 3 著者 所属(和/英) | 名古屋大学情報科学研究科 Graduate School of Information Science, Nagoya University |
第 4 著者 氏名(和/英) | 板倉 文忠 / Fumitada ITAKURA |
第 4 著者 所属(和/英) | 名城大学情報工学科 Faculty of Science and Technology, Meijo University, Meijo University |
発表年月日 | 2004/12/14 |
資料番号 | NLC2004-77,SP2004-117 |
巻番号(vol) | vol.104 |
号番号(no) | 542 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |