講演名 2021-12-02
スパース表現を用いたEnd-to-End音声認識システムの検討
矢崎 礼一郎(山梨大), 大木 真(山梨大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿では,End-to-End音声認識システムの特徴量にスパース表現の導入を検討した.End-to-Endモデルの台頭により音声認識システムは特徴量から直接文字出力を行える簡易的な設計が可能となった.これにより,従来検討される頻度の少なかった特徴抽出アルゴリズムに新しい手法の導入とその評価が容易となった.本稿では,スパース表現とEnd-to-Endを組み合わせた音声認識システムを提案し,適切なパラメータ選択や従来法との比較,性能評価を行った.
抄録(英)
キーワード(和) 音声認識 / スパースモデリング / スパース表現 / 深層学習 / End-to-End
キーワード(英)
資料番号 NLC2021-20,SP2021-41
発行日 2021-11-24 (NLC, SP)

研究会情報
研究会 NLC / IPSJ-NL / SP / IPSJ-SLP
開催期間 2021/12/1(から3日開催)
開催地(和) オンライン開催
開催地(英) Online
テーマ(和) 第23回音声言語シンポジウムおよび第8回自然言語処理シンポジウム
テーマ(英)
委員長氏名(和) 嶋田 和孝(九工大) / 関根 聡(理化学研究所) / 北岡 教英(豊橋技科大) / 北岡 教英(豊橋技術科学大学)
委員長氏名(英) Kazutaka Shimada(Kyushu Inst. of Tech.) / 関根 聡(理化学研究所) / Norihide Kitaoka(Toyohashi Univ. of Tec) / 北岡 教英(豊橋技術科学大学)
副委員長氏名(和) 吉田 光男(豊橋技科大) / 小早川 健(NHK)
副委員長氏名(英) Mitsuo Yoshida(Toyohashi Univ. of Tech.) / Takeshi Kobayakawa(NHK)
幹事氏名(和) 坂地 泰紀(東大) / 石野 亜耶(広島経済大) / 内海 慶(株式会社デンソーアイティーラボラトリ) / 内田 ゆず(北海学園大学) / 木村 泰知(小樽商科大学) / 古宮 嘉那子(東京農工大学) / 高道 慎之介(東大) / 高島 遼一(神戸大) / 秋田 祐哉(京都大学) / 太刀岡 勇気(デンソーアイティーラボラトリ) / 高島 遼一(神戸大学) / 高道 慎之介(東京大学)
幹事氏名(英) Hiroki Sakaji(Univ. of Tokyo) / Aya Ishino(Hiroshima Univ. of Economics) / 内海 慶(株式会社デンソーアイティーラボラトリ) / 内田 ゆず(北海学園大学) / 木村 泰知(小樽商科大学) / 古宮 嘉那子(東京農工大学) / Shinnosuke Takamichi(Univ. of Tokyo) / Ryouichi Takashima(Kobe Univ.) / 秋田 祐哉(京都大学) / 太刀岡 勇気(デンソーアイティーラボラトリ) / 高島 遼一(神戸大学) / 高道 慎之介(東京大学)
幹事補佐氏名(和) 高橋 寛治(Sansan) / 光田 航(NTT) / 笹野 遼平(名古屋大学) / 須藤 克仁(奈良先端科学技術大学院大学) / 横野 光(明星大学) / 吉野 幸一郎(理化学研究所) / 中鹿 亘(電通大) / 増村 亮(NTT)
幹事補佐氏名(英) Kanji Takahashi(Sansan) / Koh Mitsuda(NTT) / 笹野 遼平(名古屋大学) / 須藤 克仁(奈良先端科学技術大学院大学) / 横野 光(明星大学) / 吉野 幸一郎(理化学研究所) / Toru Nakashika(Univ. of Electro-Comm.) / Ryo Masumura(NTT)

講演論文情報詳細
申込み研究会 Technical Committee on Natural Language Understanding and Models of Communication / Special Interest Group on Natural Language / Technical Committee on Speech / Special Interest Group on Spoken Language Processing
本文の言語 JPN
タイトル(和) スパース表現を用いたEnd-to-End音声認識システムの検討
サブタイトル(和)
タイトル(英) End-to-End Speech Recognition System Using Sparse Representation
サブタイトル(和)
キーワード(1)(和/英) 音声認識
キーワード(2)(和/英) スパースモデリング
キーワード(3)(和/英) スパース表現
キーワード(4)(和/英) 深層学習
キーワード(5)(和/英) End-to-End
第 1 著者 氏名(和/英) 矢崎 礼一郎 / Reiichiro Yasaki
第 1 著者 所属(和/英) 山梨大学(略称:山梨大)
University of Yamanashi(略称:Yamanashi Univ.)
第 2 著者 氏名(和/英) 大木 真 / Makoto Ohki
第 2 著者 所属(和/英) 山梨大学(略称:山梨大)
University of Yamanashi(略称:Yamanashi Univ.)
発表年月日 2021-12-02
資料番号 NLC2021-20,SP2021-41
巻番号(vol) vol.121
号番号(no) NLC-281,SP-282
ページ範囲 pp.13-16(NLC), pp.13-16(SP),
ページ数 4
発行日 2021-11-24 (NLC, SP)