講演名 2023-12-03
[Poster Presentation] Enhancing Multi-Accent Automated Speech Recognition with Accent-Activated Adapters
Yuqin Lin(Tianjin Univ. & Univ. of Tokyo), Longbiao Wang(Tianjin Univ. & Univ. of Tokyo), Jianwu Dang(Tianjin Univ. & Univ. of Tokyo), Nobuaki Minematsu(東大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) This paper proposes the Accent-Activated adapter (AccentAct) approach to address the challenge of speech variations in multi-accent scenarios. By incorporating parallel accent and contextual extractors within a pre-trained model, AccentAct improves ASR performance while reducing computational resources. Experimental results show that AccentAct outperforms traditional methods with a significant reduction in computational requirements, promoting inclusivity for individuals with diverse accents or dialects.
抄録(英) This paper proposes the Accent-Activated adapter (AccentAct) approach to address the challenge of speech variations in multi-accent scenarios. By incorporating parallel accent and contextual extractors within a pre-trained model, AccentAct improves ASR performance while reducing computational resources. Experimental results show that AccentAct outperforms traditional methods with a significant reduction in computational requirements, promoting inclusivity for individuals with diverse accents or dialects.
キーワード(和) Automatic speech recognition / accented speech / adaptation
キーワード(英) Automatic speech recognition / accented speech / adaptation
資料番号 NLC2023-18,SP2023-38
発行日 2023-11-25 (NLC, SP)

研究会情報
研究会 SP / NLC / IPSJ-SLP / IPSJ-NL
開催期間 2023/12/2(から3日開催)
開催地(和) 機械振興会館
開催地(英) Kikai-Shinko-Kaikan Bldg.
テーマ(和) 第25回音声言語および第10回自然言語処理シンポジウム
テーマ(英)
委員長氏名(和) 戸田 智基(名大) / 吉田 光男(筑波大) / 戸田 智基(名古屋大学) / 須藤 克仁(奈良先端科学技術大学院大学)
委員長氏名(英) Tomoki Toda(Nagoya Univ.) / Mitsuo Yoshida(Univ. of Tsukuba) / 戸田 智基(名古屋大学) / 須藤 克仁(奈良先端科学技術大学院大学)
副委員長氏名(和) / 坂地 泰紀(東大) / 小早川 健(NHK)
副委員長氏名(英) / Hiroki Sakaji(Univ. of Tokyo) / Takeshi Kobayakawa(NHK)
幹事氏名(和) 安藤 厚志(NTT) / 橋本 佳(名工大) / 光田 航(rinna) / 石野 亜耶(広島経済大) / 安藤 厚志(NTT) / 橋本 佳(名工大) / 齋藤 大輔(東京大学) / 相原 龍(三菱電機) / 井之上 直也(北陸先端科学技術大学院大学) / 内田 ゆず(北海学園大学) / 佐藤 敏紀(LINE株式会社) / 萩行 正嗣(株式会社ウェザーニューズ) / 吉永 直樹(東京大学) / 吉野 幸一郎(理化学研究所)
幹事氏名(英) Atsushi Ando(NTT) / Kei Hashimoto(Nagoya Inst. of Tech.) / Ko Mitsuda(rinna) / Aya Ishino(Hiroshima Univ. of Economics) / 安藤 厚志(NTT) / 橋本 佳(名工大) / 齋藤 大輔(東京大学) / 相原 龍(三菱電機) / 井之上 直也(北陸先端科学技術大学院大学) / 内田 ゆず(北海学園大学) / 佐藤 敏紀(LINE株式会社) / 萩行 正嗣(株式会社ウェザーニューズ) / 吉永 直樹(東京大学) / 吉野 幸一郎(理化学研究所)
幹事補佐氏名(和) 相原 龍(三菱電機) / 齋藤 大輔(東大) / 高橋 寛治(Sansan) / 小川 泰弘(名大)
幹事補佐氏名(英) Ryo Aihara(Mitsubishi Electric) / Daisuke Saito(Univ. of Tokyo) / Kanjin Takahashi(Sansan) / Yasuhiro Ogawa(Nagoya Univ.)

講演論文情報詳細
申込み研究会 Technical Committee on Speech / Technical Committee on Natural Language Understanding and Models of Communication / Special Interest Group on Spoken Language Processing / Special Interest Group on Natural Language
本文の言語 ENG
タイトル(和)
サブタイトル(和)
タイトル(英) [Poster Presentation] Enhancing Multi-Accent Automated Speech Recognition with Accent-Activated Adapters
サブタイトル(和)
キーワード(1)(和/英) Automatic speech recognition / Automatic speech recognition
キーワード(2)(和/英) accented speech / accented speech
キーワード(3)(和/英) adaptation / adaptation
第 1 著者 氏名(和/英) Yuqin Lin / Yuqin Lin
第 1 著者 所属(和/英) Tianjin University(略称:Tianjin Univ. & Univ. of Tokyo)
Tianjin University(略称:Tianjin Univ. & Univ. of Tokyo)
第 2 著者 氏名(和/英) Longbiao Wang / Longbiao Wang
第 2 著者 所属(和/英) Tianjin University(略称:Tianjin Univ. & Univ. of Tokyo)
Tianjin University(略称:Tianjin Univ. & Univ. of Tokyo)
第 3 著者 氏名(和/英) Jianwu Dang / Jianwu Dang
第 3 著者 所属(和/英) Tianjin University(略称:Tianjin Univ. & Univ. of Tokyo)
Tianjin University(略称:Tianjin Univ. & Univ. of Tokyo)
第 4 著者 氏名(和/英) Nobuaki Minematsu / Nobuaki Minematsu
第 4 著者 所属(和/英) 東京大学(略称:東大)
University of Tokyo(略称:Univ. of Tokyo)
発表年月日 2023-12-03
資料番号 NLC2023-18,SP2023-38
巻番号(vol) vol.123
号番号(no) NLC-291,SP-292
ページ範囲 pp.25-30(NLC), pp.25-30(SP),
ページ数 6
発行日 2023-11-25 (NLC, SP)