講演名 2004/12/3
日本語リップリーディングシステム
サーギル アラー, 鶴田 直之, 谷口 倫一郎,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) リップリーディングは人間とコンピュータのインタフェースとして有用な手段の1つである.本稿では,我々が従来から研究を進めているHCM(Hypercolumn neural network Model)と隠れマルコフモデルを用いたリップリーディングシステムについて述べる.我々が提案するシステムではHCMを用いて画像から特徴を抽出し,隠れマルコフモデルを用いて特徴系列の認識を行う.HCMは位置不変,サイズ不変の特徴抽出を実現できるので,本システムでは対象を撮影する位置を固定せずに,認識を行うことができる.本システムの有効性を確認するために,日本語の文章を対象としたリップリーディングの実験を行った.対象画像は顔をクローズアップしたモノクロ画像であり,比較のため,特徴抽出にSOM(自己組織化マップ)とDCT(離散コサイン変換)を用いたシステムの認識性能も評価した.実験から,HCMがSOMやDCTよりも画像特徴を的確に捉えており,認識性能が優れていることが示された.
抄録(英) Lip-reading is one of the most fertile topics of interface with computer, since it can smooth the Human-Computer Interface by introducing Human-Human interaction mechanism. In this talk, we introduce a novel Japanese lip-reading system combines our group's model, Hypercolumn neural network Model (HCM), with Hidden Markov Model (HMM). HCM is used to extract the visual speech features while HMM is used for recognition. The proposed lip-reading system can work under varying lip positions and sizes. Our experiments were carried out using multiple sentences of Japanese language. All images were captured in a natural environment without using a special lighting or lip markers. Experimental results are shown to compare favourably with the results of two reported approaches : Self Organizing Map (SOM) using same database set and Discrete Cosine Transform (DCT) using different database set. HCM provides better performance than both approaches. This demonstrates that HCM can extract and classify features in a better manner than SOM and DCT.
キーワード(和) リップリーディング / 特徴抽出 / ハイパーコラムモデル / 自己組織化マップ / 隠れマルコフモデル
キーワード(英) Lip-reading / Visual features extraction / Hypercolumn model / Self organizing map / Hidden markov model
資料番号 NC2004-113
発行日

研究会情報
研究会 NC
開催期間 2004/12/3(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Neurocomputing (NC)
本文の言語 ENG
タイトル(和) 日本語リップリーディングシステム
サブタイトル(和)
タイトル(英) Japanese Lip-Reading System
サブタイトル(和)
キーワード(1)(和/英) リップリーディング / Lip-reading
キーワード(2)(和/英) 特徴抽出 / Visual features extraction
キーワード(3)(和/英) ハイパーコラムモデル / Hypercolumn model
キーワード(4)(和/英) 自己組織化マップ / Self organizing map
キーワード(5)(和/英) 隠れマルコフモデル / Hidden markov model
第 1 著者 氏名(和/英) サーギル アラー / Alaa Sagheer
第 1 著者 所属(和/英) 九州大学大学院システム情報科学府知能システム学専攻
Department of Intelligent Systems, Kyushu University
第 2 著者 氏名(和/英) 鶴田 直之 / Naoyuki Tsuruta
第 2 著者 所属(和/英) 福岡大学工学部電子情報工学科
Department of Electronics Engineering and Computer Science, Fukuoka University
第 3 著者 氏名(和/英) 谷口 倫一郎 / Rin-Ichiro Taniguchi
第 3 著者 所属(和/英) 九州大学大学院システム情報科学府知能システム学専攻
Department of Intelligent Systems, Kyushu University
発表年月日 2004/12/3
資料番号 NC2004-113
巻番号(vol) vol.104
号番号(no) 502
ページ範囲 pp.-
ページ数 6
発行日