講演名 2009-12-17
マーカーを用いた学習による特定話者の発話認識(システムオンシリコン,RFID技術,一般)
松井 駿, 浜田 望,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿では特定話者の発話認識に適した画像特徴量の構築とその取得法について提案する.特徴量の取得までの過程ではマーカー位置ベクトル,唇輪郭線形状ベクトル,固有唇パラメータという3つの情報を用いる.学習においてはマーカーを付けて発話を行い,上記3つのパラメータを取得し,マーカー位置ベクトルと他の2つの情報の関連を確立しておく.テストデータにおいてはマーカーを用いることなく,学習による関連性から唇輪郭線形状ベクトル,固有唇パラメータよりマーカー位置ベクトルの推定を行う.推定されたマーカー位置ベクトルを認識に用いる特徴量とする.DPマッチングにより29種類の単語認識を行った結果,従来特徴量より高い認識精度を得た.
抄録(英) As a visual audio fusing scheme for speech recognition in noisy environment, this paper aims to establish appropriate visual-side feature using speech recognition for a specific speaker. Three visual feature vectors are used in the learning process, such as the positions of markers attached on face, the mouth contour shape, and eigen lip images of the speaker's utterance. In test process, the latter two features are used for recognition based on the obtained association with maker locations in the learning. The proposed method gives higher recognition rate.
キーワード(和) 単語認識 / 読唇 / 画像特徴量 / マーカー / 唇輪郭 / 固有唇
キーワード(英) word recognition / lip-reading / visual feature / marker / lip contour / eigenlip
資料番号 SIS2009-40
発行日

研究会情報
研究会 SIS
開催期間 2009/12/10(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Smart Info-Media Systems (SIS)
本文の言語 JPN
タイトル(和) マーカーを用いた学習による特定話者の発話認識(システムオンシリコン,RFID技術,一般)
サブタイトル(和)
タイトル(英) Speaker Dependent Speech Recognition from Marker Training Data
サブタイトル(和)
キーワード(1)(和/英) 単語認識 / word recognition
キーワード(2)(和/英) 読唇 / lip-reading
キーワード(3)(和/英) 画像特徴量 / visual feature
キーワード(4)(和/英) マーカー / marker
キーワード(5)(和/英) 唇輪郭 / lip contour
キーワード(6)(和/英) 固有唇 / eigenlip
第 1 著者 氏名(和/英) 松井 駿 / Shun MATSUI
第 1 著者 所属(和/英) 慶應義塾大学大学院理工学研究科総合デザイン工学専攻
School of Integrated Design Engineering, Keio University
第 2 著者 氏名(和/英) 浜田 望 / Nozomu HAMADA
第 2 著者 所属(和/英) 慶應義塾大学大学院理工学研究科総合デザイン工学専攻
School of Integrated Design Engineering, Keio University
発表年月日 2009-12-17
資料番号 SIS2009-40
巻番号(vol) vol.109
号番号(no) 338
ページ範囲 pp.-
ページ数 6
発行日