講演名 2017-01-19
顔画像の対称3D-AAMによる顔方向非依存な発話認識
渡辺 拓也(豊橋技科大), 桂田 浩一(東京理科大), 金澤 靖(豊橋技科大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 読唇は口唇周辺の画像から特徴を抽出して発話を認識する技術であるが,顔の向きが正面から外れると,セルフオクルージョンが発生し,認識精度が低下する.本研究では,3D-AAMをベースとし,顔の対称性を用いたモデル化により,オクルージョンが発生した場合でも認識精度の低下を防ぐ手法を提案する. 対称3D-AAMにより取得した特徴量を用いて口形の変化をHMMでモデル化し認識を行った結果,90度から撮影した横顔の発話の認識において約4%の精度向上が見られた.
抄録(英) Lip reading is a technique to recognize spoken words from only visual images of a face. There have been proposed various approaches for lip reading, most of them, however, do not achieve enough performance for non-frontal images because of self-occlusion. In this paper, we propose an angle-independent lip-reading system that prevents deterioration of performance caused by self-occlusion using a symmetric facial model with 3D-AAM. We adopt HMM for modeling the variety of mouth shapes and use it for lip reading. The experimental results show that the recognition accuracy using symmetrical 3D-AAM increases by more than 4% compared with normal 3D-AAM when the view angle is 90 degree.
キーワード(和) 読唇 / 対称性モデル / 3D-AAM / 顔方向非依存性
キーワード(英) Lip reading / Symmetry model / 3D-AAM / View Independency
資料番号 PRMU2016-134,MVE2016-25
発行日 2017-01-12 (PRMU, MVE)

研究会情報
研究会 PRMU / IPSJ-CVIM / MVE
開催期間 2017/1/19(から2日開催)
開催地(和) 京都大学 吉田キャンパス 百周年時計台記念館
開催地(英)
テーマ(和) 人の生活・活動を支えるCV/PR/AR
テーマ(英)
委員長氏名(和) 前田 英作(NTT) / / 亀田 能成(筑波大)
委員長氏名(英) Eisaku Maeda(NTT) / / Yoshinari Kameda(Univ. of Tsukuba)
副委員長氏名(和) 内田 誠一(九大) / 藤吉 弘亘(中部大) / / 間瀬 健二(名大)
副委員長氏名(英) Seiichi Uchida(Kyushu Univ.) / Hironobu Fujiyoshi(Chubu Univ.) / / Kenji Mase(Nagoya Univ.)
幹事氏名(和) 近藤 一晃(京大) / 木村 昭悟(NTT) / / 上岡 玲子(九大) / 飯山 将晃(京大) / 木村 篤信(NTT)
幹事氏名(英) Kazuaki Kondo(Kyoto Univ.) / Akisato Kimura(NTT) / / Reiko Ueoka(Kyushu Univ.) / Masaaki Iiyama(Kyoto Univ.) / Atsunobu Kimura(NTT)
幹事補佐氏名(和) 大西 正輝(産総研) / 舩冨 卓哉(奈良先端大) / / 内山 英昭(九大) / 平山 高嗣(名大) / 青木 良輔(NTT)
幹事補佐氏名(英) Masaki Oonishi(AIST) / Takuya Funatomi(NAIST) / / Hideaki Uchiyama(Kyushu Univ.) / Takatsugu Hirayama(Nagoya Univ.) / Ryosuke Aoki(NTT)

講演論文情報詳細
申込み研究会 Technical Committee on Pattern Recognition and Media Understanding / Special Interest Group on Computer Vision and Image Media / Technical Committee on Multimedia and Virtual Environment
本文の言語 JPN
タイトル(和) 顔画像の対称3D-AAMによる顔方向非依存な発話認識
サブタイトル(和)
タイトル(英) ngle independent lip reading using symmetrical 3D-AAM of facial images
サブタイトル(和)
キーワード(1)(和/英) 読唇 / Lip reading
キーワード(2)(和/英) 対称性モデル / Symmetry model
キーワード(3)(和/英) 3D-AAM / 3D-AAM
キーワード(4)(和/英) 顔方向非依存性 / View Independency
第 1 著者 氏名(和/英) 渡辺 拓也 / Takuya Watanabe
第 1 著者 所属(和/英) 豊橋技術科学大学(略称:豊橋技科大)
Toyohashi University of Technology(略称:TUT)
第 2 著者 氏名(和/英) 桂田 浩一 / Kouichi Katsurada
第 2 著者 所属(和/英) 東京理科大学(略称:東京理科大)
Tokyo University of Science(略称:TUS)
第 3 著者 氏名(和/英) 金澤 靖 / Yasushi Kanazawa
第 3 著者 所属(和/英) 豊橋技術科学大学(略称:豊橋技科大)
Toyohashi University of Technology(略称:TUT)
発表年月日 2017-01-19
資料番号 PRMU2016-134,MVE2016-25
巻番号(vol) vol.116
号番号(no) PRMU-411,MVE-412
ページ範囲 pp.135-140(PRMU), pp.135-140(MVE),
ページ数 6
発行日 2017-01-12 (PRMU, MVE)