距離画像のフレーム連結画像を用いたConvolutional Neural Networkによる手話単語認識

橋村 佳祐; 齊藤 剛史

講演名	2016-10-16 距離画像のフレーム連結画像を用いたConvolutional Neural Networkによる手話単語認識橋村佳祐(九工大), 齊藤剛史(九工大),
PDFダウンロードページ	PDFダウンロードページへ
抄録(和)	我々は，シーンよりフレーム画像を取り出してタイル状に連結して一枚の画像（フレーム連結画像）を作成し，フレーム連結画像を入力としてCNNを用いて認識する手法を提案している．本稿では，手話シーンより取得できる距離画像を用いた手話シーン向けのフレーム連結画像，およびフレーム連結画像を用いたCNNによる手話単語認識手法を提案する．Kinectセンサにより取得された手話単語100語の手話シーンを用いて認識実験を実施した結果，右手のみを用いたフレーム連結画像で最も高い認識率を得た．この精度は手の位置や動きを考慮した従来手法よりも高い認識精度であり，提案手法の有効性を確認した．
抄録(英)	We proposed a concatenated frame image (CFI) that some sampled frame images from the scene are concatenated like a two-dimensional tile, and proposed a framework of CFI-based convolutional neural network (CNN). In this paper, we propose an improved CFI for sign language scene and CFI-based CNN for sign language recognition (SLR). The proposed method was evaluated with 100 words of sign language acquired by Kinect sensor. As the result, right-hand based CFI obtained the highest recognition accuracy. This performance is better than the traditional method which involved not only the hand shape but also hand location and its movement. It is confirmed that the proposed method is efficient for SLR.
キーワード(和)	手話認識 / 距離画像 / Convolutional Neural Network / フレーム連結画像
キーワード(英)	Sign language recognition / depth image / convolutional neural network / concatenated sequence image
資料番号	WIT2016-36
発行日	2016-10-09 (WIT)

研究会情報
研究会	WIT
開催期間	2016/10/16(から2日開催)
開催地（和）	唐津ロイヤルホテル（佐賀県唐津市）
開催地（英）	Karatsu Royal Hotel (Saga pref.)
テーマ（和）	福祉情報工学、人間工学、一般
テーマ（英）	Ergonomics and Well-being Information Technology, etc.
委員長氏名（和）	布川清彦(東京国際大)
委員長氏名（英）	Kiyohiko Nunokawa(Tokyo International Univ.)
副委員長氏名（和）	和田親宗(九工大)
副委員長氏名（英）	Chikamune Wada(Kyushu Inst. of Tech.)
幹事氏名（和）	酒向慎司(名工大) / 梶谷勇(産総研) / 若月大輔(筑波技大)
幹事氏名（英）	Shinji Sakou(Nagoya Inst. of Tech.) / Isamu Kajitani(AIST) / Daisuke Wakatsuki(Tsukuba Univ. of Tech.)
幹事補佐氏名（和）	雨宮智浩(NTT) / 塩野目剛亮(筑波技大) / 宮城愛美(筑波技大) / 半田隆志(埼玉県産技総合センター)
幹事補佐氏名（英）	Tomohiro Amemiya(NTT) / Takeaki Shionome(Tsukuba Univ. of Tech.) / Manabi Miyagi(Tsukuba Univ. of Tech.) / Takashi Handa(Saitama Industrial Technology Center)

講演論文情報詳細
申込み研究会	Technical Committee on Well-being Information Technology
本文の言語	JPN
タイトル（和）	距離画像のフレーム連結画像を用いたConvolutional Neural Networkによる手話単語認識
サブタイトル（和）
タイトル（英）	Sign language recognition by convolutional neural network with concatenated sequence image of depth image
サブタイトル（和）
キーワード(1)（和/英）	手話認識 / Sign language recognition
キーワード(2)（和/英）	距離画像 / depth image
キーワード(3)（和/英）	Convolutional Neural Network / convolutional neural network
キーワード(4)（和/英）	フレーム連結画像 / concatenated sequence image
第 1 著者氏名（和/英）	橋村佳祐 / Keisuke Hashimura
第 1 著者所属（和/英）	九州工業大学(略称：九工大) Kyushu Institute of Technology(略称：kyutech)
第 2 著者氏名（和/英）	齊藤剛史 / Takeshi Saitoh
第 2 著者所属（和/英）	九州工業大学(略称：九工大) Kyushu Institute of Technology(略称：kyutech)
発表年月日	2016-10-16
資料番号	WIT2016-36
巻番号（vol）	vol.116
号番号（no）	WIT-248
ページ範囲	pp.17-22(WIT),
ページ数	6
発行日	2016-10-09 (WIT)