顔画像の対称3D-AAMによる顔方向非依存な発話認識

渡辺 拓也; 桂田 浩一; 金澤 靖

講演名	2017-01-19 顔画像の対称3D-AAMによる顔方向非依存な発話認識渡辺拓也(豊橋技科大), 桂田浩一(東京理科大), 金澤靖(豊橋技科大),
PDFダウンロードページ	PDFダウンロードページへ
抄録(和)	読唇は口唇周辺の画像から特徴を抽出して発話を認識する技術であるが，顔の向きが正面から外れると，セルフオクルージョンが発生し，認識精度が低下する．本研究では，3D-AAMをベースとし，顔の対称性を用いたモデル化により，オクルージョンが発生した場合でも認識精度の低下を防ぐ手法を提案する．対称3D-AAMにより取得した特徴量を用いて口形の変化をHMMでモデル化し認識を行った結果，90度から撮影した横顔の発話の認識において約4%の精度向上が見られた．
抄録(英)	Lip reading is a technique to recognize spoken words from only visual images of a face. There have been proposed various approaches for lip reading, most of them, however, do not achieve enough performance for non-frontal images because of self-occlusion. In this paper, we propose an angle-independent lip-reading system that prevents deterioration of performance caused by self-occlusion using a symmetric facial model with 3D-AAM. We adopt HMM for modeling the variety of mouth shapes and use it for lip reading. The experimental results show that the recognition accuracy using symmetrical 3D-AAM increases by more than 4% compared with normal 3D-AAM when the view angle is 90 degree.
キーワード(和)	読唇 / 対称性モデル / 3D-AAM / 顔方向非依存性
キーワード(英)	Lip reading / Symmetry model / 3D-AAM / View Independency
資料番号	PRMU2016-134,MVE2016-25
発行日	2017-01-12 (PRMU, MVE)

研究会情報
研究会	PRMU / IPSJ-CVIM / MVE
開催期間	2017/1/19(から2日開催)
開催地（和）	京都大学吉田キャンパス百周年時計台記念館
開催地（英）
テーマ（和）	人の生活・活動を支えるCV/PR/AR
テーマ（英）
委員長氏名（和）	前田英作(NTT) / / 亀田能成(筑波大)
委員長氏名（英）	Eisaku Maeda(NTT) / / Yoshinari Kameda(Univ. of Tsukuba)
副委員長氏名（和）	内田誠一(九大) / 藤吉弘亘(中部大) / / 間瀬健二(名大)
副委員長氏名（英）	Seiichi Uchida(Kyushu Univ.) / Hironobu Fujiyoshi(Chubu Univ.) / / Kenji Mase(Nagoya Univ.)
幹事氏名（和）	近藤一晃(京大) / 木村昭悟(NTT) / / 上岡玲子(九大) / 飯山将晃(京大) / 木村篤信(NTT)
幹事氏名（英）	Kazuaki Kondo(Kyoto Univ.) / Akisato Kimura(NTT) / / Reiko Ueoka(Kyushu Univ.) / Masaaki Iiyama(Kyoto Univ.) / Atsunobu Kimura(NTT)
幹事補佐氏名（和）	大西正輝(産総研) / 舩冨卓哉(奈良先端大) / / 内山英昭(九大) / 平山高嗣(名大) / 青木良輔(NTT)
幹事補佐氏名（英）	Masaki Oonishi(AIST) / Takuya Funatomi(NAIST) / / Hideaki Uchiyama(Kyushu Univ.) / Takatsugu Hirayama(Nagoya Univ.) / Ryosuke Aoki(NTT)

講演論文情報詳細
申込み研究会	Technical Committee on Pattern Recognition and Media Understanding / Special Interest Group on Computer Vision and Image Media / Technical Committee on Multimedia and Virtual Environment
本文の言語	JPN
タイトル（和）	顔画像の対称3D-AAMによる顔方向非依存な発話認識
サブタイトル（和）
タイトル（英）	ngle independent lip reading using symmetrical 3D-AAM of facial images
サブタイトル（和）
キーワード(1)（和/英）	読唇 / Lip reading
キーワード(2)（和/英）	対称性モデル / Symmetry model
キーワード(3)（和/英）	3D-AAM / 3D-AAM
キーワード(4)（和/英）	顔方向非依存性 / View Independency
第 1 著者氏名（和/英）	渡辺拓也 / Takuya Watanabe
第 1 著者所属（和/英）	豊橋技術科学大学(略称：豊橋技科大) Toyohashi University of Technology(略称：TUT)
第 2 著者氏名（和/英）	桂田浩一 / Kouichi Katsurada
第 2 著者所属（和/英）	東京理科大学(略称：東京理科大) Tokyo University of Science(略称：TUS)
第 3 著者氏名（和/英）	金澤靖 / Yasushi Kanazawa
第 3 著者所属（和/英）	豊橋技術科学大学(略称：豊橋技科大) Toyohashi University of Technology(略称：TUT)
発表年月日	2017-01-19
資料番号	PRMU2016-134,MVE2016-25
巻番号（vol）	vol.116
号番号（no）	PRMU-411,MVE-412
ページ範囲	pp.135-140(PRMU), pp.135-140(MVE),
ページ数	6
発行日	2017-01-12 (PRMU, MVE)