講演名 | 2023-12-03 Enhancing Recognition of Rare Words in ASR through Error Detection and Context-Aware Error Correction Jiajun He(名大), Zekun Yang(名大), Tomoki Toda(名大), |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | Automatic speech recognition (ASR) systems often suffer from errors, particularly when recognizing rare words. These errors can be detrimental to downstream tasks such as keyword spotting and language understanding. To alleviate this issue, we propose an ASR error correction method that improves rare word recognition based on error detection and context-aware error correction. Our proposed method limits decoding to only the positions where corrections are required to minimize unnecessary computations. A rare word list is also used to provide additional contextual information for the model to correct errors related to rare words. Experimental results demonstrate that our proposed method outperforms previous works by a large margin in word error rate (WER) on five public datasets while also maintaining a reasonable inference speed. Additionally, the proposed method shows reasonable robustness across different ASR systems. |
抄録(英) | Automatic speech recognition (ASR) systems often suffer from errors, particularly when recognizing rare words. These errors can be detrimental to downstream tasks such as keyword spotting and language understanding. To alleviate this issue, we propose an ASR error correction method that improves rare word recognition based on error detection and context-aware error correction. Our proposed method limits decoding to only the positions where corrections are required to minimize unnecessary computations. A rare word list is also used to provide additional contextual information for the model to correct errors related to rare words. Experimental results demonstrate that our proposed method outperforms previous works by a large margin in word error rate (WER) on five public datasets while also maintaining a reasonable inference speed. Additionally, the proposed method shows reasonable robustness across different ASR systems. |
キーワード(和) | automatic speech recognition / rare words / context-aware error correction |
キーワード(英) | automatic speech recognition / rare words / context-aware error correction |
資料番号 | NLC2023-16,SP2023-36 |
発行日 | 2023-11-25 (NLC, SP) |
研究会情報 | |
研究会 | SP / NLC / IPSJ-SLP / IPSJ-NL |
---|---|
開催期間 | 2023/12/2(から3日開催) |
開催地(和) | 機械振興会館 |
開催地(英) | Kikai-Shinko-Kaikan Bldg. |
テーマ(和) | 第25回音声言語および第10回自然言語処理シンポジウム |
テーマ(英) | |
委員長氏名(和) | 戸田 智基(名大) / 吉田 光男(筑波大) / 戸田 智基(名古屋大学) / 須藤 克仁(奈良先端科学技術大学院大学) |
委員長氏名(英) | Tomoki Toda(Nagoya Univ.) / Mitsuo Yoshida(Univ. of Tsukuba) / 戸田 智基(名古屋大学) / 須藤 克仁(奈良先端科学技術大学院大学) |
副委員長氏名(和) | / 坂地 泰紀(東大) / 小早川 健(NHK) |
副委員長氏名(英) | / Hiroki Sakaji(Univ. of Tokyo) / Takeshi Kobayakawa(NHK) |
幹事氏名(和) | 安藤 厚志(NTT) / 橋本 佳(名工大) / 光田 航(rinna) / 石野 亜耶(広島経済大) / 安藤 厚志(NTT) / 橋本 佳(名工大) / 齋藤 大輔(東京大学) / 相原 龍(三菱電機) / 井之上 直也(北陸先端科学技術大学院大学) / 内田 ゆず(北海学園大学) / 佐藤 敏紀(LINE株式会社) / 萩行 正嗣(株式会社ウェザーニューズ) / 吉永 直樹(東京大学) / 吉野 幸一郎(理化学研究所) |
幹事氏名(英) | Atsushi Ando(NTT) / Kei Hashimoto(Nagoya Inst. of Tech.) / Ko Mitsuda(rinna) / Aya Ishino(Hiroshima Univ. of Economics) / 安藤 厚志(NTT) / 橋本 佳(名工大) / 齋藤 大輔(東京大学) / 相原 龍(三菱電機) / 井之上 直也(北陸先端科学技術大学院大学) / 内田 ゆず(北海学園大学) / 佐藤 敏紀(LINE株式会社) / 萩行 正嗣(株式会社ウェザーニューズ) / 吉永 直樹(東京大学) / 吉野 幸一郎(理化学研究所) |
幹事補佐氏名(和) | 相原 龍(三菱電機) / 齋藤 大輔(東大) / 高橋 寛治(Sansan) / 小川 泰弘(名大) |
幹事補佐氏名(英) | Ryo Aihara(Mitsubishi Electric) / Daisuke Saito(Univ. of Tokyo) / Kanjin Takahashi(Sansan) / Yasuhiro Ogawa(Nagoya Univ.) |
講演論文情報詳細 | |
申込み研究会 | Technical Committee on Speech / Technical Committee on Natural Language Understanding and Models of Communication / Special Interest Group on Spoken Language Processing / Special Interest Group on Natural Language |
---|---|
本文の言語 | ENG-JTITLE |
タイトル(和) | Enhancing Recognition of Rare Words in ASR through Error Detection and Context-Aware Error Correction |
サブタイトル(和) | |
タイトル(英) | Enhancing Recognition of Rare Words in ASR through Error Detection and Context-Aware Error Correction |
サブタイトル(和) | |
キーワード(1)(和/英) | automatic speech recognition / automatic speech recognition |
キーワード(2)(和/英) | rare words / rare words |
キーワード(3)(和/英) | context-aware error correction / context-aware error correction |
第 1 著者 氏名(和/英) | Jiajun He / Jiajun He |
第 1 著者 所属(和/英) | Nagoya University(略称:名大) Nagoya University(略称:Nagoya Univ.) |
第 2 著者 氏名(和/英) | Zekun Yang / Zekun Yang |
第 2 著者 所属(和/英) | Nagoya University(略称:名大) Nagoya University(略称:Nagoya Univ.) |
第 3 著者 氏名(和/英) | Tomoki Toda / Tomoki Toda |
第 3 著者 所属(和/英) | Nagoya University(略称:名大) Nagoya University(略称:Nagoya Univ.) |
発表年月日 | 2023-12-03 |
資料番号 | NLC2023-16,SP2023-36 |
巻番号(vol) | vol.123 |
号番号(no) | NLC-291,SP-292 |
ページ範囲 | pp.13-18(NLC), pp.13-18(SP), |
ページ数 | 6 |
発行日 | 2023-11-25 (NLC, SP) |