講演名 2012-05-25
雑音抑圧とSPLICEを組み合わせた雑音環境下音声認識(オーガナイズドセッション:スピーチエンハンスメント,音声・音響信号処理,音声及び一般)
甲斐 常伸, 鈴木 雅之, 峯松 信明, 広瀬 啓吉,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 近年携帯端末やカーナビゲーションシステムなどを,音声入力を用いて操作する場面が多くなっている.しかし実環境下での音声入力は様々な雑音が混入してしまい,クリーン環境で構築された音響モデルのみが使われていた場合,認識率の大きな低下を招くことになる.音声の特徴量から雑音の影響を取り除く手法は特徴量正規化,特徴強調など様々な手法が提案されているが,単一の手法で影響をすべて取り除くことは難しい.そこで本稿ではこれらの手法を組み合わせてより雑音に頑健な音声認識を目指す.SPLICE(Stereo-Piecewise LInear Compensation for Environments)は任意の特徴量を入力として扱える高い汎用性を持っている.そこで既存手法とSPLICEの組み合わせの中で,各手法の特性が有効に働くを組み合わせを検討する.Aurora-2データベースを用いた英語連続数字音声認識のタスクにおいて,AFE(Advanced Front-End),SPLICE,HEQ(Histogram EQualization)を順番に適用した特徴量がどの環境においても優れた性能を示した.
抄録(英) Recently, voices are often used as input modality to mobile terminals or car navigation systems. However, the voices recorded in actual environment frequently contain various kinds of noise and, because of that, the performance of automatic speech recognition systems is largely degraded. To reduce the influence of noise, various methods such as feature normalization or feature enhancement are proposed but a single method cannot reduce all types of the influence of noise. In this paper, we aim at noise robust recognition to combine those methods. SPLICE (Stereo-Piecewise LInear Compensation for Environments) has the characteristics to accept any type of features as its input. So, we investigate a good combination of the existing methods and SPLICE to maximize the performance and the robustness. In English connected digit recognition experiments performed on the Aurora-2 database, the combination of AFE, SPLICE and HEQ in this order showed the highest performance and robustness.
キーワード(和) 雑音環境下音声認識 / HEQ / AFE / SPLICE
キーワード(英) Speech recognition in noisy environment / HEQ / AFE / SPLICE
資料番号 EA2012-28,SIP2012-28,SP2012-28
発行日

研究会情報
研究会 EA
開催期間 2012/5/17(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Engineering Acoustics (EA)
本文の言語 JPN
タイトル(和) 雑音抑圧とSPLICEを組み合わせた雑音環境下音声認識(オーガナイズドセッション:スピーチエンハンスメント,音声・音響信号処理,音声及び一般)
サブタイトル(和)
タイトル(英) Combination of noise compensation and SPLICE for noise robust speech recognition
サブタイトル(和)
キーワード(1)(和/英) 雑音環境下音声認識 / Speech recognition in noisy environment
キーワード(2)(和/英) HEQ / HEQ
キーワード(3)(和/英) AFE / AFE
キーワード(4)(和/英) SPLICE / SPLICE
第 1 著者 氏名(和/英) 甲斐 常伸 / Tsunenobu KAI
第 1 著者 所属(和/英) 東京大学
The University of Tokyo
第 2 著者 氏名(和/英) 鈴木 雅之 / Masayuki SUZUKI
第 2 著者 所属(和/英) 東京大学
The University of Tokyo
第 3 著者 氏名(和/英) 峯松 信明 / Nobuaki MINEMATSU
第 3 著者 所属(和/英) 東京大学
The University of Tokyo
第 4 著者 氏名(和/英) 広瀬 啓吉 / Keikichi HIROSE
第 4 著者 所属(和/英) 東京大学
The University of Tokyo
発表年月日 2012-05-25
資料番号 EA2012-28,SIP2012-28,SP2012-28
巻番号(vol) vol.112
号番号(no) 47
ページ範囲 pp.-
ページ数 6
発行日