講演名 2011/12/12
顔領域の違いによる読話認識性能比較(ポスターセッション,第13回音声言語シンポジウム)
池田 大輔, 桂田 浩一, 入部 百合絵, 新田 恒雄,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 読話とは口の動きや形状を読み取り発話内容を理解することである.従来の読話の研究の多くは口唇領域に対して行われてきた.しかし,発話する音によっては口の動作が大きく周辺の鍛や顎の形状の変化が大きい音や,口の動作が小さい音がある.そこで本論文では(A)顔全体,(B)口周辺,(C)口唇領域の3つの領域を用いて単語認識,母音・子音認識を行った.実験の結果,母音の認識は顔全体領域が最も高い性能を示し,一方で子音の/r/や/s/は口唇領域が最も高い値を示すことが分かった.
抄録(英) Lipreading is the technique to recognize speaker's utterances from the motion with changing shape of the mouth. Although most of previous approaches to lipreading focus on the limited region of the mouth, utterances of some phonemes often accompanying with the motion of surrounding areas together with the mouth. We have compared three regions, (A) entire face region, (B) mouth and adjacent region, and (C) mouth region, based on these facts. Experimental results of word recognition and vowel/consonant recognition show that vowel recognition using the entire face region results in the highest performance, while the mouth region outputs the best performance for recognizing consonants 's' and 'r'.
キーワード(和)
キーワード(英)
資料番号 Vol.2011-SLP-89 No.18
発行日

研究会情報
研究会 NLC
開催期間 2011/12/12(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 JPN
タイトル(和) 顔領域の違いによる読話認識性能比較(ポスターセッション,第13回音声言語シンポジウム)
サブタイトル(和)
タイトル(英) Comparison of Lipreading Recognition Using Different Facial Regions
サブタイトル(和)
キーワード(1)(和/英)
第 1 著者 氏名(和/英) 池田 大輔 / Daisuke Ikeda
第 1 著者 所属(和/英) 豊橋技術科学大学
Toyohashi University of Technology
第 2 著者 氏名(和/英) 桂田 浩一 / Kouichi Katsurada
第 2 著者 所属(和/英) 豊橋技術科学大学
Toyohashi University of Technology
第 3 著者 氏名(和/英) 入部 百合絵 / Yurie Iribe
第 3 著者 所属(和/英) 豊橋技術科学大学
Toyohashi University of Technology
第 4 著者 氏名(和/英) 新田 恒雄 / Tsuneo Nitta
第 4 著者 所属(和/英) 豊橋技術科学大学
Toyohashi University of Technology
発表年月日 2011/12/12
資料番号 Vol.2011-SLP-89 No.18
巻番号(vol) vol.111
号番号(no) 364
ページ範囲 pp.-
ページ数 6
発行日