講演名 2010-03-12
MSD-HMMによる隠れ領域を考慮した手話動作のモデル化
酒向 慎司, 北村 正,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 動画像から手話を認識することは,センサー等の特殊な装置の使用やその身体的拘束を伴わない方法として有効であるが,撮像されている人物から手話の動作特徴を的確に取得する必要がある.しかし,手話動作において,両手が交差することなどよって特徴となる部位が隠れてしまう状況は避けられず,とくに単眼カメラの映像から手動作の軌跡を正確に抽出することは難しいと言える.しかし,そのような状況を回避するために,多数のカメラを用いることは先に述べた装置の特殊化にも繋がる点で問題である.本報告では,特徴部位が隠れることも手話動作の特徴としてとらえるという着想から,手話動作を表す特徴部位の可視状態と不可視状態が混在した一連の現象を説明することができるモデル化方法として,多空間分布に基づいた隠れマルコフモデル(multi-space distribution hidden Markov model: MSD-HMM)を適用した手法を提案する.手話単語データべースを用いた実験によって,MSD-HMMによるモデル化が機能していることを示し,単語認識実験によってその有効性を確認するとともに,今後の課題について述べる.
抄録(英) In sign language recognition system, there are two main methods for capturing hands movement from signers. The first one is generally called the motion capture method which uses special sensors (e.g. CyberGlove[○!R]) capture the movement of the signer. The second one, which is called image-based approach relies on videos of signers to capture signs. In this paper, We adopt the second approach. While image-based approach has some advantages against sensor-based approach, it is difficult to overcome occlusion problems. Hidden Markov Model (HMM) have been widely used in sign language recognition. Also, in the field on speech recognition and speech synthesis, HMM have been used for acoustic modeling. In speech synthesis domain, Multi-space probability HMM (MSD-HMM) have been proposed as an extension of HMM that includes discrete and continuous HMM. We adopt MSD-HMM technique in order to overcome occlusion problems. This paper describes to use multi-space probability distribution (MSD) to model occluded hand positions jointly with visible hand positions. Experimental result obtained in Japanese sign language recognition indicate MSD provided almost equal to word recognition accuracy across conventional HMM method using interpolated trajectory of hand positions.
キーワード(和) 手話認識 / 隠れマルコフモデル / 多空間確率分布 / オクルージョン
キーワード(英) Hidden Markov Model / Sign Language Recognition / Multi-space distribution / Occlusion
資料番号 WIT2009-88
発行日

研究会情報
研究会 WIT
開催期間 2010/3/5(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Well-being Information Technology(WIT)
本文の言語 JPN
タイトル(和) MSD-HMMによる隠れ領域を考慮した手話動作のモデル化
サブタイトル(和)
タイトル(英) MSD-HMM for Occluded Hands in Sign Language Operation
サブタイトル(和)
キーワード(1)(和/英) 手話認識 / Hidden Markov Model
キーワード(2)(和/英) 隠れマルコフモデル / Sign Language Recognition
キーワード(3)(和/英) 多空間確率分布 / Multi-space distribution
キーワード(4)(和/英) オクルージョン / Occlusion
第 1 著者 氏名(和/英) 酒向 慎司 / Shinji SAKO
第 1 著者 所属(和/英) 名古屋工業大学大学院工学研究科情報工学専攻
Department of Computer Science and Engineering Graduate School of Engineering, Nagoya Institute of Technology
第 2 著者 氏名(和/英) 北村 正 / Tadashi KITAMURA
第 2 著者 所属(和/英) 名古屋工業大学大学院工学研究科情報工学専攻
Department of Computer Science and Engineering Graduate School of Engineering, Nagoya Institute of Technology
発表年月日 2010-03-12
資料番号 WIT2009-88
巻番号(vol) vol.109
号番号(no) 467
ページ範囲 pp.-
ページ数 6
発行日