雑音重畳音声と強調音声の併用による単一チャネル雑音下音声認識

藤本 雅清; 河井 恒

講演名	2018-07-26 雑音重畳音声と強調音声の併用による単一チャネル雑音下音声認識藤本雅清(NICT), 河井恒(NICT),
PDFダウンロードページ	PDFダウンロードページへ
抄録(和)	多くの場合，単一チャネルによる音声強調を用いると音声歪みの影響により，音声強調を行わない場合に比べて音声認識性能が劣化する傾向にある．この問題に対して，本研究では特徴量レベルで雑音重畳音声と強調音声を結合し，音声認識の入力とすることにより音声認識性能の改善が得られることを示す．また，特徴量レベルでの単純な結合だけでなく，それぞれの音声のDNN（補助ネットワーク）レベルでの結合，ゲート機構によるそれぞれの音声の明示的な取捨選択を導入することにより更なる改善が得られることを示す．
抄録(英)	In many cases, single channel speech enhancement seriously deteriorates speech recognition accuracy due to the influence of speech distortion. In this paper, we propose a method of single channel noise robust speech recognition based on feature-level combination of noisy speech and enhanced speech. In addition, we also reveal that further improvements are obtained by using DNN-level (sub-network) combination and a gating mechanism which can explicitly select adequate speech signal.
キーワード(和)	雑音に頑健な音声認識 / 音声強調 / 単一チャネル入力 / 特徴量／補助ネットワーク結合 / ゲート機構
キーワード(英)	noise robust speech recognition / speech enhancement / single-channel input / feature / sub-network combination / gating mechanism
資料番号	SP2018-19
発行日	2018-07-19 (SP)

研究会情報
研究会	SP / IPSJ-SLP
開催期間	2018/7/26(から2日開催)
開催地（和）	舘山寺サゴーロイヤルホテル
開催地（英）	Sago-Royal-Hotel (Hamamatsu)
テーマ（和）	認識，理解，対話，一般
テーマ（英）	Speech recognition and understanding, dialog system, etc.
委員長氏名（和）	山下洋一(立命館大) / 西村雅史(静岡大)
委員長氏名（英）	Yoichi Yamashita(Ritsumeikan Univ.) / Masafumi Nishimura(Shizuoka Univ.)
副委員長氏名（和）	李晃伸(名工大)
副委員長氏名（英）	Akinobu Ri(Nagoya Inst. of Tech.)
幹事氏名（和）	南條浩輝(京大) / 坂野秀樹(名城大) / 福田隆(日本IBM) / 山岸順一(NII) / 塩田さやか(首都大東京) / 俵直弘(早稲田大)
幹事氏名（英）	Hiroaki Nanjo(Kyoto Univ.) / Hideki Banno(Meijo Univ.) / Takashi Fukuda(IBM Japan) / Junichi Yamagishi(NII) / Sayaka Shiota(Tokyo Metropolitan Univ.) / Naohiro Tawara(Waseda Univ.)
幹事補佐氏名（和）	郡山知樹(東工大) / 小橋川哲(NTT)
幹事補佐氏名（英）	Tomoki Koriyama(Tokyo Inst. of Tech.) / Satoshi Kobashikawa(NTT)

講演論文情報詳細
申込み研究会	Technical Committee on Speech / Special Interest Group on Spoken Language Processing
本文の言語	JPN
タイトル（和）	雑音重畳音声と強調音声の併用による単一チャネル雑音下音声認識
サブタイトル（和）
タイトル（英）	Single channel noisy speech recognition based on combination of noisy speech and enhanced speech
サブタイトル（和）
キーワード(1)（和/英）	雑音に頑健な音声認識 / noise robust speech recognition
キーワード(2)（和/英）	音声強調 / speech enhancement
キーワード(3)（和/英）	単一チャネル入力 / single-channel input
キーワード(4)（和/英）	特徴量／補助ネットワーク結合 / feature / sub-network combination
キーワード(5)（和/英）	ゲート機構 / gating mechanism
第 1 著者氏名（和/英）	藤本雅清 / Masakiyo Fujimoto
第 1 著者所属（和/英）	情報通信研究機構(略称：NICT) National Institute of Information and Communications Technology(略称：NICT)
第 2 著者氏名（和/英）	河井恒 / Hisashi Kawai
第 2 著者所属（和/英）	情報通信研究機構(略称：NICT) National Institute of Information and Communications Technology(略称：NICT)
発表年月日	2018-07-26
資料番号	SP2018-19
巻番号（vol）	vol.118
号番号（no）	SP-160
ページ範囲	pp.15-20(SP),
ページ数	6
発行日	2018-07-19 (SP)