スパース表現を用いたEnd-to-End音声認識システムの検討

矢崎 礼一郎; 大木 真

講演名	2021-12-02 スパース表現を用いたEnd-to-End音声認識システムの検討矢崎礼一郎(山梨大), 大木真(山梨大),
PDFダウンロードページ	PDFダウンロードページへ
抄録(和)	本稿では，End-to-End音声認識システムの特徴量にスパース表現の導入を検討した．End-to-Endモデルの台頭により音声認識システムは特徴量から直接文字出力を行える簡易的な設計が可能となった．これにより，従来検討される頻度の少なかった特徴抽出アルゴリズムに新しい手法の導入とその評価が容易となった．本稿では，スパース表現とEnd-to-Endを組み合わせた音声認識システムを提案し，適切なパラメータ選択や従来法との比較，性能評価を行った．
抄録(英)
キーワード(和)	音声認識 / スパースモデリング / スパース表現 / 深層学習 / End-to-End
キーワード(英)
資料番号	NLC2021-20,SP2021-41
発行日	2021-11-24 (NLC, SP)

研究会情報
研究会	NLC / IPSJ-NL / SP / IPSJ-SLP
開催期間	2021/12/1(から3日開催)
開催地（和）	オンライン開催
開催地（英）	Online
テーマ（和）	第23回音声言語シンポジウムおよび第8回自然言語処理シンポジウム
テーマ（英）
委員長氏名（和）	嶋田和孝(九工大) / 関根聡(理化学研究所) / 北岡教英(豊橋技科大) / 北岡教英(豊橋技術科学大学)
委員長氏名（英）	Kazutaka Shimada(Kyushu Inst. of Tech.) / 関根聡(理化学研究所) / Norihide Kitaoka(Toyohashi Univ. of Tec) / 北岡教英(豊橋技術科学大学)
副委員長氏名（和）	吉田光男(豊橋技科大) / 小早川健(NHK)
副委員長氏名（英）	Mitsuo Yoshida(Toyohashi Univ. of Tech.) / Takeshi Kobayakawa(NHK)
幹事氏名（和）	坂地泰紀(東大) / 石野亜耶(広島経済大) / 内海慶(株式会社デンソーアイティーラボラトリ) / 内田ゆず(北海学園大学) / 木村泰知(小樽商科大学) / 古宮嘉那子(東京農工大学) / 高道慎之介(東大) / 高島遼一(神戸大) / 秋田祐哉(京都大学) / 太刀岡勇気(デンソーアイティーラボラトリ) / 高島遼一(神戸大学) / 高道慎之介(東京大学)
幹事氏名（英）	Hiroki Sakaji(Univ. of Tokyo) / Aya Ishino(Hiroshima Univ. of Economics) / 内海慶(株式会社デンソーアイティーラボラトリ) / 内田ゆず(北海学園大学) / 木村泰知(小樽商科大学) / 古宮嘉那子(東京農工大学) / Shinnosuke Takamichi(Univ. of Tokyo) / Ryouichi Takashima(Kobe Univ.) / 秋田祐哉(京都大学) / 太刀岡勇気(デンソーアイティーラボラトリ) / 高島遼一(神戸大学) / 高道慎之介(東京大学)
幹事補佐氏名（和）	高橋寛治(Sansan) / 光田航(NTT) / 笹野遼平(名古屋大学) / 須藤克仁(奈良先端科学技術大学院大学) / 横野光(明星大学) / 吉野幸一郎(理化学研究所) / 中鹿亘(電通大) / 増村亮(NTT)
幹事補佐氏名（英）	Kanji Takahashi(Sansan) / Koh Mitsuda(NTT) / 笹野遼平(名古屋大学) / 須藤克仁(奈良先端科学技術大学院大学) / 横野光(明星大学) / 吉野幸一郎(理化学研究所) / Toru Nakashika(Univ. of Electro-Comm.) / Ryo Masumura(NTT)

講演論文情報詳細
申込み研究会	Technical Committee on Natural Language Understanding and Models of Communication / Special Interest Group on Natural Language / Technical Committee on Speech / Special Interest Group on Spoken Language Processing
本文の言語	JPN
タイトル（和）	スパース表現を用いたEnd-to-End音声認識システムの検討
サブタイトル（和）
タイトル（英）	End-to-End Speech Recognition System Using Sparse Representation
サブタイトル（和）
キーワード(1)（和/英）	音声認識
キーワード(2)（和/英）	スパースモデリング
キーワード(3)（和/英）	スパース表現
キーワード(4)（和/英）	深層学習
キーワード(5)（和/英）	End-to-End
第 1 著者氏名（和/英）	矢崎礼一郎 / Reiichiro Yasaki
第 1 著者所属（和/英）	山梨大学(略称：山梨大) University of Yamanashi(略称：Yamanashi Univ.)
第 2 著者氏名（和/英）	大木真 / Makoto Ohki
第 2 著者所属（和/英）	山梨大学(略称：山梨大) University of Yamanashi(略称：Yamanashi Univ.)
発表年月日	2021-12-02
資料番号	NLC2021-20,SP2021-41
巻番号（vol）	vol.121
号番号（no）	NLC-281,SP-282
ページ範囲	pp.13-16(NLC), pp.13-16(SP),
ページ数	4
発行日	2021-11-24 (NLC, SP)