講演抄録/キーワード |
講演名 |
2014-10-24 14:20
[招待講演]会話シーン分析の複数人自由会話音声認識における音声強調 ○荒木章子・堀 貴明・中谷智広(NTT) EA2014-25 |
抄録 |
(和) |
著者らは,複数人会話シーン分析をタスクとした遠隔発話音声認識のための音声強調技術に取り組んでいる.音声強調では,残響除去・音源分離・雑音除去の各技術を用いているが,従来の空間的特徴を利用したマルチチャネル処理に加え,事前学習に基づく音声スペクトル情報も考慮した技術も導入することで,より音声認識に適した音声強調を実現している.本稿では,これらの会話シーン分析タスクでの音声強調の方法とその音声認識精度に与える効果について,最新状況を報告する.また,近年注目を集めているディープラーニングを用いた音声認識における音声強調の効果についても言及する. |
(英) |
This paper illustrates speech enhancement techniques for multi-speaker distant-talk speech recognition, where a conversation scene analysis is adopted as a test scenario. Our speech enhancement techniques include dereverberation, speech separation, and noise suppression. Because some of our techniques employ both the spatial information of speech sources and the speech spectrum information, their output signals become suitable for the input of a speech recognizer. We report the latest speech enhancement techniques and their speech recognition performance in a real conversation. Moreover, the effect of deep learning in multi-speaker speech recognition is also discussed. |
キーワード |
(和) |
会話シーン分析 / 残響除去 / 音源分離 / 雑音除去 / DNN-HMM音声認識 / / / |
(英) |
Conversation scene analysis / dereverberation / speech separation / noise suppression / speech recognition with DNN-HMM / / / |
文献情報 |
信学技報, vol. 114, no. 274, EA2014-25, pp. 9-14, 2014年10月. |
資料番号 |
EA2014-25 |
発行日 |
2014-10-17 (EA) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
EA2014-25 |