大会名称
2008年 情報科学技術フォーラム(FIT)
大会コ-ド
F
開催年
2008
発行日
2008/8/20
セッション番号
10
セッション名
情報・システム研究開発の今昔-若者の夢をどこまで膨らませる-
講演日
2008/9/3
講演場所(会議室等)
第2イベント会場
講演番号
10-4
タイトル
唇および口内領域形状に基づくトラジェクトリ特徴量による読唇
著者名
齊藤 剛史
キーワード
抄録
視覚情報を利用した発話内容の認識,いわゆる読唇に関する研究は,1980年代後半より取り組まれている.音声認識では,周囲の雑音の影響により認識率の低下を招く問題がある.一方,視覚情報は雑音の影響を含まれず,高騒音下での認識が可能となる利点をもつ.しかし,読唇は音声認識に比べ報告例が少なく認識率が低い.この問題を解決するために,講演者らはフレーム毎に計測される特徴量の時間的変化を空間上にプロットし,軌道として表現するトラジェクトリ特徴量を提案した.さらに唇および口内領域形状に着目し,これまで提案されてきた手法に比べ高い認識率を得られることを,比較実験を通して確認した.本講演では,講演者がこれまで取り組んできた読唇に関して,単音認識および単語認識について紹介する.