講演名 2012-02-10
手話素単位を用いた大語彙手話認識(テーマセッション,時系列パターン認識)
佐藤 新, 篠田 浩一,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 手話認識における語彙を限定しない大語彙認識の一手法を提案する.従来の手話認識手法の多くは単語HMMを用いた認識が行われているが,これらの手法では大語彙手話認識にそのまま適用することは困難である.そこで,音声の大語彙認識における音素単位に倣って,手話のさらに細かい単位である手話素単位で手話をモデル化することによって大語彙手話認識が可能になると考えられる.そこでは,手話認識に適した手話素の定義ならびに手話素を用いた認識アルゴリズムの開発が課題となる.本手法では,手話を右手・左手各々の「手の位置・動き」「手の形」「手首の向き」計6種類の要素の時系列データの組で表現し,それぞれの要素における手話素単位およびそのHMMを定義する.そして,要素ごとの出力尤度の重み付き和を認識に用いる.評価実験としてDepthカメラで撮影された258単語のアメリカ手話に対して手話の孤立単語認識を行い,語彙クローズドの条件での単語HMMによる正解率93.7%に対して提案手法では78.2%を得た.また,469単語の語彙オープンの条件での提案手法の正解率は23.6%となった.さらに,話者非依存の条件では単語HMMの正解率11.5%に対して提案手法の正解率は18.8%となった.
抄録(英) We propose a large vocabulary sign language recognition method. While most conventional methods used word units for sign language modeling, it is difficult to apply such methods to large-vocabulary recognition. Inspired by the use of phoneme units in speech recognition, we introduce "chereme" unit models in large-vocabulary sign language recognition. The problems are how to define cheremes and developing a recognition algorithm using cheremes. We first represent signs using the 6 elements: "hand movement-hold", "hand shape" and "wrist direction" of both hands. Then, we define chereme unit HMMs in each element. We use the weighted sum of output probabilities of the HMMs of these elements for recognition. We evaluated our method by using isolated sign language recognition. We achieved 78.2% word correct on the closed set of 258 words and 23.6% word correct on the open set with 469 words. We also achieved 18.8% word correct on speaker-independent recognition.
キーワード(和) 大語彙手話認識 / 手話素 / 隠れマルコフモデル
キーワード(英) large-vocabrary sign language recognition / chereme / hidden Markov model
資料番号 PRMU2011-222,SP2011-137
発行日

研究会情報
研究会 SP
開催期間 2012/2/2(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) 手話素単位を用いた大語彙手話認識(テーマセッション,時系列パターン認識)
サブタイトル(和)
タイトル(英) Large Vocabrary Sign Language Recognition Based on Cheremes
サブタイトル(和)
キーワード(1)(和/英) 大語彙手話認識 / large-vocabrary sign language recognition
キーワード(2)(和/英) 手話素 / chereme
キーワード(3)(和/英) 隠れマルコフモデル / hidden Markov model
第 1 著者 氏名(和/英) 佐藤 新 / Arata SATO
第 1 著者 所属(和/英) 東京工業大学大学院情報理工学系研究科計算工学専攻
Department of Computer Science, Tokyo Institute of Technology
第 2 著者 氏名(和/英) 篠田 浩一 / Koichi SHINODA
第 2 著者 所属(和/英) 東京工業大学大学院情報理工学系研究科計算工学専攻
Department of Computer Science, Tokyo Institute of Technology
発表年月日 2012-02-10
資料番号 PRMU2011-222,SP2011-137
巻番号(vol) vol.111
号番号(no) 431
ページ範囲 pp.-
ページ数 6
発行日