講演名 2016-10-16
距離画像のフレーム連結画像を用いたConvolutional Neural Networkによる手話単語認識
橋村 佳祐(九工大), 齊藤 剛史(九工大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 我々は,シーンよりフレーム画像を取り出してタイル状に連結して一枚の画像(フレーム連結画像)を作成し,フレーム連結画像を入力としてCNNを用いて認識する手法を提案している.本稿では,手話シーンより取得できる距離画像を用いた手話シーン向けのフレーム連結画像,およびフレーム連結画像を用いたCNNによる手話単語認識手法を提案する.Kinectセンサにより取得された手話単語100語の手話シーンを用いて認識実験を実施した結果,右手のみを用いたフレーム連結画像で最も高い認識率を得た.この精度は手の位置や動きを考慮した従来手法よりも高い認識精度であり,提案手法の有効性を確認した.
抄録(英) We proposed a concatenated frame image (CFI) that some sampled frame images from the scene are concatenated like a two-dimensional tile, and proposed a framework of CFI-based convolutional neural network (CNN). In this paper, we propose an improved CFI for sign language scene and CFI-based CNN for sign language recognition (SLR). The proposed method was evaluated with 100 words of sign language acquired by Kinect sensor. As the result, right-hand based CFI obtained the highest recognition accuracy. This performance is better than the traditional method which involved not only the hand shape but also hand location and its movement. It is confirmed that the proposed method is efficient for SLR.
キーワード(和) 手話認識 / 距離画像 / Convolutional Neural Network / フレーム連結画像
キーワード(英) Sign language recognition / depth image / convolutional neural network / concatenated sequence image
資料番号 WIT2016-36
発行日 2016-10-09 (WIT)

研究会情報
研究会 WIT
開催期間 2016/10/16(から2日開催)
開催地(和) 唐津ロイヤルホテル(佐賀県唐津市)
開催地(英) Karatsu Royal Hotel (Saga pref.)
テーマ(和) 福祉情報工学、人間工学、一般
テーマ(英) Ergonomics and Well-being Information Technology, etc.
委員長氏名(和) 布川 清彦(東京国際大)
委員長氏名(英) Kiyohiko Nunokawa(Tokyo International Univ.)
副委員長氏名(和) 和田 親宗(九工大)
副委員長氏名(英) Chikamune Wada(Kyushu Inst. of Tech.)
幹事氏名(和) 酒向 慎司(名工大) / 梶谷 勇(産総研) / 若月 大輔(筑波技大)
幹事氏名(英) Shinji Sakou(Nagoya Inst. of Tech.) / Isamu Kajitani(AIST) / Daisuke Wakatsuki(Tsukuba Univ. of Tech.)
幹事補佐氏名(和) 雨宮 智浩(NTT) / 塩野目 剛亮(筑波技大) / 宮城 愛美(筑波技大) / 半田 隆志(埼玉県産技総合センター)
幹事補佐氏名(英) Tomohiro Amemiya(NTT) / Takeaki Shionome(Tsukuba Univ. of Tech.) / Manabi Miyagi(Tsukuba Univ. of Tech.) / Takashi Handa(Saitama Industrial Technology Center)

講演論文情報詳細
申込み研究会 Technical Committee on Well-being Information Technology
本文の言語 JPN
タイトル(和) 距離画像のフレーム連結画像を用いたConvolutional Neural Networkによる手話単語認識
サブタイトル(和)
タイトル(英) Sign language recognition by convolutional neural network with concatenated sequence image of depth image
サブタイトル(和)
キーワード(1)(和/英) 手話認識 / Sign language recognition
キーワード(2)(和/英) 距離画像 / depth image
キーワード(3)(和/英) Convolutional Neural Network / convolutional neural network
キーワード(4)(和/英) フレーム連結画像 / concatenated sequence image
第 1 著者 氏名(和/英) 橋村 佳祐 / Keisuke Hashimura
第 1 著者 所属(和/英) 九州工業大学(略称:九工大)
Kyushu Institute of Technology(略称:kyutech)
第 2 著者 氏名(和/英) 齊藤 剛史 / Takeshi Saitoh
第 2 著者 所属(和/英) 九州工業大学(略称:九工大)
Kyushu Institute of Technology(略称:kyutech)
発表年月日 2016-10-16
資料番号 WIT2016-36
巻番号(vol) vol.116
号番号(no) WIT-248
ページ範囲 pp.17-22(WIT),
ページ数 6
発行日 2016-10-09 (WIT)