講演名 2020-03-02
End-to-end音声認識における会議音声への適応および回り込み音声の影響軽減
大内 一亜(静岡大), 甲斐 充彦(静岡大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 会議音声の自動書き起こしのような実環境下での複数話者音声認識では,話者別に与えた近接マイクで収録しても,周囲の話者の音声が回り込んで重畳することで音声認識性能が低下する.本稿では,大規模読み上げ音声データセットからの転移学習によって会議音声に適応したEnd-to-end 音声認識モデルを用い,回り込み音声によって生じる悪影響について調査する.まず,サブワード単位を出力ラベルに用いるEnd-to-end 音声認識モデルの転移学習により,従来のDNN/HMM ハイブリッド型音声認識モデルと同等以上の認識精度が得られることを示す.更に話者へ焦点を当てる構造を組み込むことで,音声特徴量系列から話者の発話区間を推定しその書き起こしを予測するという一連の処理を1 つのモデルとして扱い全体として最適化するモデル化手法を提案する.英語会議音声のAMI コーパスを用いて提案手法の評価を行ったところ,不正確な発話区間による音声認識システムの性能劣化を抑えられることが明らかになった.
抄録(英)
キーワード(和) 音声認識 / 会議音声 / 回り込み音声 / End-to-end音声認識 / AMIコーパス
キーワード(英)
資料番号 EA2019-111,SIP2019-113,SP2019-60
発行日 2020-02-24 (EA, SIP, SP)

研究会情報
研究会 SP / EA / SIP
開催期間 2020/3/2(から2日開催)
開催地(和) 沖縄産業支援センター
開催地(英) Okinawa Industry Support Center
テーマ(和) 音声,応用/電気音響,信号処理,一般
テーマ(英)
委員長氏名(和) 河井 恒(NICT) / 古家 賢一(大分大) / 相川 直幸(東京理科大)
委員長氏名(英) Hisashi Kawai(NICT) / Kenichi Furuya(Oita Univ.) / Naoyuki Aikawa(TUS)
副委員長氏名(和) 李 晃伸(名工大) / 島内 末廣(金沢工大) / 武岡 成人(静岡理工科大) / 林 和則(阪市大) / 坂東 幸浩(NTT)
副委員長氏名(英) Akinobu Ri(Nagoya Inst. of Tech.) / Suehiro Shimauchi(Kanazawa Inst. of Tech.) / Shigeto Takeoka(Shizuoka Inst. of Science and Tech.) / Kazunori Hayashi(Osaka City Univ) / Yukihiro Bandou(NTT)
幹事氏名(和) 南條 浩輝(京大) / 小川 哲司(早大) / 松井 健太郎(NHK) / 小山 翔一(東大) / 中本 昌由(広島大) / 小西 克巳(法政大)
幹事氏名(英) Hiroaki Nanjo(Kyoto Univ.) / Tetsuji Ogawa(Waseda Univ.) / Kentaro Matsui(NHK) / Shoichi Koyama(Univ. of Tokyo) / Masayoshi Nakamoto(Hiroshima Univ.) / Katsumi Konishi(Hosei Univ.)
幹事補佐氏名(和) 郡山 知樹(東大) / 井島 勇祐(NTT) / 井本 桂右(立命館大) / 森川 大輔(富山県立大) / 杉本 憲治郎(早大)
幹事補佐氏名(英) Tomoki Koriyama(Univ. of Tokyo) / Yusuke Ijima(NTT) / Keisuke Imoto(Ritsumeikan Univ.) / Daisuke Morikawa(Toyama Pref Univ.) / Kenjiro Sugimoto(Waseda Univ.)

講演論文情報詳細
申込み研究会 Technical Committee on Speech / Technical Committee on Engineering Acoustics / Technical Committee on Signal Processing
本文の言語 JPN
タイトル(和) End-to-end音声認識における会議音声への適応および回り込み音声の影響軽減
サブタイトル(和)
タイトル(英) Adaptation to Meeting Speech and Mitigation of Wraparound Speech for End-to-end Speech Recognition
サブタイトル(和)
キーワード(1)(和/英) 音声認識
キーワード(2)(和/英) 会議音声
キーワード(3)(和/英) 回り込み音声
キーワード(4)(和/英) End-to-end音声認識
キーワード(5)(和/英) AMIコーパス
第 1 著者 氏名(和/英) 大内 一亜 / Kazua Ouchi
第 1 著者 所属(和/英) 静岡大学大学院(略称:静岡大)
Shizuoka University(略称:Shizuoka Univ.)
第 2 著者 氏名(和/英) 甲斐 充彦 / Atsuhiko Kai
第 2 著者 所属(和/英) 静岡大学(略称:静岡大)
Shizuoka University(略称:Shizuoka Univ.)
発表年月日 2020-03-02
資料番号 EA2019-111,SIP2019-113,SP2019-60
巻番号(vol) vol.119
号番号(no) EA-439,SIP-440,SP-441
ページ範囲 pp.59-64(EA), pp.59-64(SIP), pp.59-64(SP),
ページ数 6
発行日 2020-02-24 (EA, SIP, SP)