講演名 2014-10-24
会話シーン分析の複数人自由会話音声認識における音声強調(招待講演)
荒木 章子, 堀 貴明, 中谷 智広,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 著者らは,複数人会話シーン分析をタスクとした遠隔発話音声認識のための音声強調技術に取り組んでいる.音声強調では,残響除去・音源分離・雑音除去の核技術を用いているが,従来の空間的特徴を利用したマルチチャネル処理に加え,事前学習に基づく音声スペクトル情報も考慮した技術も導入することで,より音声認識に適した音声強調を実現している.本稿では,これらの会話シーン分析タスクでの音声強調の方法とその音声認識精度に与える効果について,最新状況を報告する.また,近年注目を集めているディープラーニングを用いた音声認識における音声強調の効果についても言及する.
抄録(英) This paper illustrates speech enhancement techniques for multi-speaker distant-talk speech recognition, where a conversation scene analysis is adopted as a test scenario. Our speech enhancement techniques include dereverberation, speech separation, and noise suppression. Because some of our techniques employ both the spatial information of speech sources and the speech spectrum information, their output signals become suitable for the input of a speech recognizer. We report the latest speech enhancement techniques and their speech recognition performance in a real conversation. Moreover, the effect of deep learning in multi-speaker speech recognition is also discussed.
キーワード(和) 会話シーン分析 / 残響除去 / 音源分離 / 雑音除去 / DNN-HMM音声認識
キーワード(英) Conversation scene analysis / dereverberation / speech separation / noise suppression / speech recognition with DNN-HMM
資料番号 EA2014-25
発行日

研究会情報
研究会 EA
開催期間 2014/10/17(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Engineering Acoustics (EA)
本文の言語 JPN
タイトル(和) 会話シーン分析の複数人自由会話音声認識における音声強調(招待講演)
サブタイトル(和)
タイトル(英) Speech enhancement techniques in multi-speaker spontaneous speech recognition for conversation scene analysis(Invited Talk)
サブタイトル(和)
キーワード(1)(和/英) 会話シーン分析 / Conversation scene analysis
キーワード(2)(和/英) 残響除去 / dereverberation
キーワード(3)(和/英) 音源分離 / speech separation
キーワード(4)(和/英) 雑音除去 / noise suppression
キーワード(5)(和/英) DNN-HMM音声認識 / speech recognition with DNN-HMM
第 1 著者 氏名(和/英) 荒木 章子 / Shoko ARAKI
第 1 著者 所属(和/英) 日本電信電話株式会社NTTコミュニケーション科学基礎研究所
NTT Communication Science Laboratories, NTT Corporation
第 2 著者 氏名(和/英) 堀 貴明 / Takaaki HORI
第 2 著者 所属(和/英) 日本電信電話株式会社NTTコミュニケーション科学基礎研究所
NTT Communication Science Laboratories, NTT Corporation
第 3 著者 氏名(和/英) 中谷 智広 / Tomohiro NAKATANI
第 3 著者 所属(和/英) 日本電信電話株式会社NTTコミュニケーション科学基礎研究所
NTT Communication Science Laboratories, NTT Corporation
発表年月日 2014-10-24
資料番号 EA2014-25
巻番号(vol) vol.114
号番号(no) 274
ページ範囲 pp.-
ページ数 6
発行日