講演名 2022-06-17
BERTを用いた音声翻訳のための音声認識結果訂正の検討
小椋 忠志(NICT), 藤本 雅清(NICT), 沈 鵬(NICT), Lu Xugang(NICT), 河井 恒(NICT),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 音声認識と機械翻訳からなる音声翻訳技術においては,入り口となる音声認識の性能改善が重要である.しかし,単純な音声認識器の改善のみでは問題解決は難しく,音声認識結果に対する何らかの誤り訂正処理が必要である.そこで本研究では,近年注目を集めている巨大言語モデルBERTを用いた音声翻訳向けの音声認識結果訂正手法について検討した.提案手法では文脈を考慮した訂正を行うことができ,発話内容の「意味」や「意図」を違えることを軽減した高精度な音声翻訳結果を得ることができる.
抄録(英) Speech translation (ST) technology consists of automatic speech recognition (ASR) and machine translation technologies. Since ASR is the first module to be processed in ST, improving ASR performance is a critical factor in ST. However, it is difficult to solve this problem by pursuing only improvement of ASR performance, and error correction processing for ASR results is strongly required. Therefore, in this paper, we propose an error correction method for ASR results to improve ST performance using the state-of-the-art huge scale language model, BERT. The proposed method realizes context-aware error correction for ASR results, and successfully improves the accuracy of ST by reducing misunderstandings of “meaning" and "intention" of utterances.
キーワード(和) BERT / 音声翻訳 / 誤り訂正
キーワード(英) BERT / Spech Translation / Error Correction
資料番号 SP2022-4
発行日 2022-06-10 (SP)

研究会情報
研究会 SP / IPSJ-MUS / IPSJ-SLP
開催期間 2022/6/17(から2日開催)
開催地(和) オンライン開催
開催地(英) Online
テーマ(和) 音学シンポジウム2022
テーマ(英)
委員長氏名(和) 戸田 智基(名大)
委員長氏名(英) Tomoki Toda(Nagoya Univ.)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和) 増村 亮(NTT) / 中鹿 亘(電通大)
幹事氏名(英) Ryo Masumura(NTT) / Toru Nakashika(Univ. of Electro-Comm.)
幹事補佐氏名(和) 相原 龍(三菱電機) / 齋藤 大輔(東大)
幹事補佐氏名(英) Ryo Aihara(Mitsubishi Electric) / Daisuke Saito(Univ. of Tokyo)

講演論文情報詳細
申込み研究会 Technical Committee on Speech / Special Interest Group on Music and Computer / Special Interest Group on Spoken Language Processing
本文の言語 JPN
タイトル(和) BERTを用いた音声翻訳のための音声認識結果訂正の検討
サブタイトル(和)
タイトル(英) A Study of Speech Recognition Result Correction Using BERT for Speech Translation
サブタイトル(和)
キーワード(1)(和/英) BERT / BERT
キーワード(2)(和/英) 音声翻訳 / Spech Translation
キーワード(3)(和/英) 誤り訂正 / Error Correction
第 1 著者 氏名(和/英) 小椋 忠志 / Tadashi Ogura
第 1 著者 所属(和/英) 国立研究開発法人情報通信研究機構(略称:NICT)
National Institute of Information and Communications Technology(略称:NICT)
第 2 著者 氏名(和/英) 藤本 雅清 / Masakiyo Fujimoto
第 2 著者 所属(和/英) 国立研究開発法人情報通信研究機構(略称:NICT)
National Institute of Information and Communications Technology(略称:NICT)
第 3 著者 氏名(和/英) 沈 鵬 / Peng Shen
第 3 著者 所属(和/英) 国立研究開発法人情報通信研究機構(略称:NICT)
National Institute of Information and Communications Technology(略称:NICT)
第 4 著者 氏名(和/英) Lu Xugang / Xugang Lu
第 4 著者 所属(和/英) 国立研究開発法人情報通信研究機構(略称:NICT)
National Institute of Information and Communications Technology(略称:NICT)
第 5 著者 氏名(和/英) 河井 恒 / Hisashi Kawai
第 5 著者 所属(和/英) 国立研究開発法人情報通信研究機構(略称:NICT)
National Institute of Information and Communications Technology(略称:NICT)
発表年月日 2022-06-17
資料番号 SP2022-4
巻番号(vol) vol.122
号番号(no) SP-81
ページ範囲 pp.10-13(SP),
ページ数 4
発行日 2022-06-10 (SP)