講演名 2023-12-03
Enhancing Recognition of Rare Words in ASR through Error Detection and Context-Aware Error Correction
Jiajun He(名大), Zekun Yang(名大), Tomoki Toda(名大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) Automatic speech recognition (ASR) systems often suffer from errors, particularly when recognizing rare words. These errors can be detrimental to downstream tasks such as keyword spotting and language understanding. To alleviate this issue, we propose an ASR error correction method that improves rare word recognition based on error detection and context-aware error correction. Our proposed method limits decoding to only the positions where corrections are required to minimize unnecessary computations. A rare word list is also used to provide additional contextual information for the model to correct errors related to rare words. Experimental results demonstrate that our proposed method outperforms previous works by a large margin in word error rate (WER) on five public datasets while also maintaining a reasonable inference speed. Additionally, the proposed method shows reasonable robustness across different ASR systems.
抄録(英) Automatic speech recognition (ASR) systems often suffer from errors, particularly when recognizing rare words. These errors can be detrimental to downstream tasks such as keyword spotting and language understanding. To alleviate this issue, we propose an ASR error correction method that improves rare word recognition based on error detection and context-aware error correction. Our proposed method limits decoding to only the positions where corrections are required to minimize unnecessary computations. A rare word list is also used to provide additional contextual information for the model to correct errors related to rare words. Experimental results demonstrate that our proposed method outperforms previous works by a large margin in word error rate (WER) on five public datasets while also maintaining a reasonable inference speed. Additionally, the proposed method shows reasonable robustness across different ASR systems.
キーワード(和) automatic speech recognition / rare words / context-aware error correction
キーワード(英) automatic speech recognition / rare words / context-aware error correction
資料番号 NLC2023-16,SP2023-36
発行日 2023-11-25 (NLC, SP)

研究会情報
研究会 SP / NLC / IPSJ-SLP / IPSJ-NL
開催期間 2023/12/2(から3日開催)
開催地(和) 機械振興会館
開催地(英) Kikai-Shinko-Kaikan Bldg.
テーマ(和) 第25回音声言語および第10回自然言語処理シンポジウム
テーマ(英)
委員長氏名(和) 戸田 智基(名大) / 吉田 光男(筑波大) / 戸田 智基(名古屋大学) / 須藤 克仁(奈良先端科学技術大学院大学)
委員長氏名(英) Tomoki Toda(Nagoya Univ.) / Mitsuo Yoshida(Univ. of Tsukuba) / 戸田 智基(名古屋大学) / 須藤 克仁(奈良先端科学技術大学院大学)
副委員長氏名(和) / 坂地 泰紀(東大) / 小早川 健(NHK)
副委員長氏名(英) / Hiroki Sakaji(Univ. of Tokyo) / Takeshi Kobayakawa(NHK)
幹事氏名(和) 安藤 厚志(NTT) / 橋本 佳(名工大) / 光田 航(rinna) / 石野 亜耶(広島経済大) / 安藤 厚志(NTT) / 橋本 佳(名工大) / 齋藤 大輔(東京大学) / 相原 龍(三菱電機) / 井之上 直也(北陸先端科学技術大学院大学) / 内田 ゆず(北海学園大学) / 佐藤 敏紀(LINE株式会社) / 萩行 正嗣(株式会社ウェザーニューズ) / 吉永 直樹(東京大学) / 吉野 幸一郎(理化学研究所)
幹事氏名(英) Atsushi Ando(NTT) / Kei Hashimoto(Nagoya Inst. of Tech.) / Ko Mitsuda(rinna) / Aya Ishino(Hiroshima Univ. of Economics) / 安藤 厚志(NTT) / 橋本 佳(名工大) / 齋藤 大輔(東京大学) / 相原 龍(三菱電機) / 井之上 直也(北陸先端科学技術大学院大学) / 内田 ゆず(北海学園大学) / 佐藤 敏紀(LINE株式会社) / 萩行 正嗣(株式会社ウェザーニューズ) / 吉永 直樹(東京大学) / 吉野 幸一郎(理化学研究所)
幹事補佐氏名(和) 相原 龍(三菱電機) / 齋藤 大輔(東大) / 高橋 寛治(Sansan) / 小川 泰弘(名大)
幹事補佐氏名(英) Ryo Aihara(Mitsubishi Electric) / Daisuke Saito(Univ. of Tokyo) / Kanjin Takahashi(Sansan) / Yasuhiro Ogawa(Nagoya Univ.)

講演論文情報詳細
申込み研究会 Technical Committee on Speech / Technical Committee on Natural Language Understanding and Models of Communication / Special Interest Group on Spoken Language Processing / Special Interest Group on Natural Language
本文の言語 ENG-JTITLE
タイトル(和) Enhancing Recognition of Rare Words in ASR through Error Detection and Context-Aware Error Correction
サブタイトル(和)
タイトル(英) Enhancing Recognition of Rare Words in ASR through Error Detection and Context-Aware Error Correction
サブタイトル(和)
キーワード(1)(和/英) automatic speech recognition / automatic speech recognition
キーワード(2)(和/英) rare words / rare words
キーワード(3)(和/英) context-aware error correction / context-aware error correction
第 1 著者 氏名(和/英) Jiajun He / Jiajun He
第 1 著者 所属(和/英) Nagoya University(略称:名大)
Nagoya University(略称:Nagoya Univ.)
第 2 著者 氏名(和/英) Zekun Yang / Zekun Yang
第 2 著者 所属(和/英) Nagoya University(略称:名大)
Nagoya University(略称:Nagoya Univ.)
第 3 著者 氏名(和/英) Tomoki Toda / Tomoki Toda
第 3 著者 所属(和/英) Nagoya University(略称:名大)
Nagoya University(略称:Nagoya Univ.)
発表年月日 2023-12-03
資料番号 NLC2023-16,SP2023-36
巻番号(vol) vol.123
号番号(no) NLC-291,SP-292
ページ範囲 pp.13-18(NLC), pp.13-18(SP),
ページ数 6
発行日 2023-11-25 (NLC, SP)