大会名称
2020年 総合大会
大会コ-ド
2020G
開催年
2020
発行日
2020-03-03
セッション番号
D-12B
セッション名
パターン認識・メディア理解B
講演日
2020/3/19
講演場所(会議室等)
工学部 講義棟2F 218講義室
講演番号
D-12-48
タイトル
データ拡張による手話動作識別性能の向上に関する実験的検討
著者名
◎川口開都Daraseneeyakul PapornVeerakiatikit Phaphimon西村広光田中 博
キーワード
データ拡張, 学習モデル, 事前学習済みネットワーク, VGG16, LSTM, 識別
抄録
当研究室ではカラー手袋を装着して光学カメラを用いた手話翻訳システムの実現に取り組んでいる.学習モデルの作成にあたっては,多人数の正しい手話動作収集が困難である.本稿では,データ拡張による識別性能向上を目的として,事前学習済みネットワークVGG16を用いて検討を行った.現実の変動要素を考慮して,拡大/縮小 1%,2%,3%,回転1°,2°,3°,水平移動4cm,6cm,8cm,垂直移動4cm,8cm,12cmによる拡張を行った.拡張データを各60個の学習データに対して作成,合計120とした.識別性能は各拡張方法によって差があるものの,向上していた.垂直移動4cmでは,62%から71%に向上した.
本文pdf
PDF download   

PayPerView