講演抄録/キーワード |
講演名 |
2013-07-25 15:10
騒音環境下音声認識に対する識別的アプローチの有効性 第2回CHiMEチャレンジ ○太刀岡勇気(三菱電機)・渡部晋治・ルルー ジョナトン・ハーシー ジョン(MERL) SP2013-55 |
抄録 |
(和) |
第2回CHiMEチャレンジは,非定常の妨害音を伴う2マイクロフォンでの困難な音声認識タスクである.我々は識別学習や様々な特徴量変換,ディープニューラルネットといった先端的な音声認識の手法の残響・騒音音声認識に対する有効性を検証した.騒音抑圧には音源到来方向を推定し,事前分布を用いてバイナリマスクを行うシンプルな方法を用いた.さらに任意の特徴量を識別的特徴量変換に導入可能な拡張識別的特徴量変換,識別的言語モデリングとベイズリスク最小化デコーディングを音声認識の後段で効率的に統合する手法を提案した.これらはCHiMEチャレンジのTrack2である中程度の語彙タスクに有効であり,参加者中最も高い性能を獲得した. |
(英) |
The 2nd CHiME challenge is a difficult two-microphone speech recognition task with non-stationary interference. We investigate the effectiveness of state-of-the-art ASR techniques such as discriminative training, various feature transformations and deep neural networks for reverberated and noisy speech recognition, combined with a simple noise suppression method relying on prior-based binary masking with estimated angle of arrival. Moreover, we propose an augmented discriminative feature transformation that can introduce arbitrary features to a discriminative feature transform, an efficient combination method of discriminative language modeling and minimum Bayes risk decoding in an ASR post-processing stage. These techniques are effective for middle-vocabulary sub-task (Track 2) of CHiME challenge. Our performance is the best among participants. |
キーワード |
(和) |
CHiME チャレンジ / 耐騒音音声認識 / 識別的手法 / 特徴量変換 / 事前分布に基づくバイナリマスク / / / |
(英) |
CHiME challenge / Noise robust ASR / Discriminative methods / Feature transformation / Prior-based binary masking / / / |
文献情報 |
信学技報, vol. 113, no. 161, SP2013-55, pp. 13-18, 2013年7月. |
資料番号 |
SP2013-55 |
発行日 |
2013-07-18 (SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2013-55 |