講演名 2022-03-08
ディープ・ラーニングを用いた手話認識に関する研究
磯谷 光(豊田高専), 木村 勉(豊田高専), 神田 和幸(国立民族学博物館),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本研究では機械学習を用いた手話認識において,手話文中で使用されている単語の認識を目的とする.手話文中に発生する遷移動作を考慮して学習するために,手話文を学習データとして機械学習を行い,学習済みモデルを作成する.本研究では音声認識における手法であるConnectionist Temporal Classification (CTC)を組み込んだモデルと,自然言語処理で活用されるTransformerを利用したConformerネットワークを使用したモデルの2つの手法で実験した.最終的にテストデータ全体の認識率はCTC手法が約74%,Conformer手法が約32%となった.しかし,Conformer手法の認識結果は過学習のような現象が見られ,正常に動作していない可能性があると考えた.今後はConformer手法の改善を進めつつ,TransformerとCTCを組み合わせた新たなアルゴリズムについても検討する.
抄録(英) In this study, our purpose is to recognize signs using machine learning. In order to take into account the transition motions that occur in a sign sentence, machine learning adopts the sign sentences as training data, and a trained model is created. We experimented two models: one that incorporates Connectionist Temporal Classification (CTC) which is a method used in speech recognition, and the other is a conformer model that uses a transformer used in natural language processing. As the result, the recognition rate for the entire test data was about 74% by the CTC method and about 32% by the Conformer method. However, the recognition results of the Conformer method showed a phenomenon as over-learning, and we estimated that it might worked properly. We will improve the Conformer method and will investigate a new algorithm that combines the Transformer with CTC.
キーワード(和) 手話認識 / ディープ・ラーニング / Connectionist Temporal Classification / Transformer / Conformer
キーワード(英) Sign Recognition / Deep Learning / Connectionist Temporal Classification / Transformer / Conformer
資料番号 WIT2021-48
発行日 2022-03-01 (WIT)

研究会情報
研究会 WIT / IPSJ-AAC
開催期間 2022/3/8(から2日開催)
開催地(和) オンライン開催
開催地(英) Online
テーマ(和) 聴覚・視覚障害者支援、一般
テーマ(英)
委員長氏名(和) 酒向 慎司(名工大)
委員長氏名(英) Shinji Sakou(Nagoya Inst. of Tech.)
副委員長氏名(和) 雨宮 智浩(東大)
副委員長氏名(英) Tomohiro Amemiya(Univ. of Tokyo)
幹事氏名(和) 半田 隆志(埼玉県産業技術総合センター) / 塩野目 剛亮(帝京大) / 宮城 愛美(筑波技術大)
幹事氏名(英) Takashi Handa(Saitama Industrial Tech. Center) / Takeaki Shionome(Teikyo Univ.) / Manabi Miyagi(Tsukuba Univ. of Tech.)
幹事補佐氏名(和) 細野 美奈子(産総研) / 菅野 亜紀(名大) / 小森 智康(NHK)
幹事補佐氏名(英) Minako Hosono(AIST) / Aki Sugano(Nagoya Univ.) / Tomoyasu Komori(NHK)

講演論文情報詳細
申込み研究会 Technical Committee on Well-being Information Technology / Special Interest Group on Assistive & Accessible Computin
本文の言語 JPN
タイトル(和) ディープ・ラーニングを用いた手話認識に関する研究
サブタイトル(和) CTCとConformerの比較
タイトル(英) A Study on Sign Recognition Using Deep Learning
サブタイトル(和) Comparison between CTC and Conformer
キーワード(1)(和/英) 手話認識 / Sign Recognition
キーワード(2)(和/英) ディープ・ラーニング / Deep Learning
キーワード(3)(和/英) Connectionist Temporal Classification / Connectionist Temporal Classification
キーワード(4)(和/英) Transformer / Transformer
キーワード(5)(和/英) Conformer / Conformer
第 1 著者 氏名(和/英) 磯谷 光 / Hikaru Isogai
第 1 著者 所属(和/英) 豊田工業高等専門学校(略称:豊田高専)
National Institute of Technology, Toyota College(略称:NIT, Toyota College)
第 2 著者 氏名(和/英) 木村 勉 / Tsutomu Kimura
第 2 著者 所属(和/英) 豊田工業高等専門学校(略称:豊田高専)
National Institute of Technology, Toyota College(略称:NIT, Toyota College)
第 3 著者 氏名(和/英) 神田 和幸 / Kanda Kazuyuki
第 3 著者 所属(和/英) 国立民族学博物館(略称:国立民族学博物館)
National Museum of Ethnology(略称:National Museum of Ethnology)
発表年月日 2022-03-08
資料番号 WIT2021-48
巻番号(vol) vol.121
号番号(no) WIT-418
ページ範囲 pp.29-34(WIT),
ページ数 6
発行日 2022-03-01 (WIT)