大会名称 |
---|
2008年 情報科学技術フォーラム(FIT) |
大会コ-ド |
F |
開催年 |
2008 |
発行日 |
2008/8/20 |
セッション番号 |
10 |
セッション名 |
情報・システム研究開発の今昔-若者の夢をどこまで膨らませる- |
講演日 |
2008/9/3 |
講演場所(会議室等) |
第2イベント会場 |
講演番号 |
10-4 |
タイトル |
唇および口内領域形状に基づくトラジェクトリ特徴量による読唇 |
著者名 |
齊藤 剛史, |
キーワード |
抄録 |
視覚情報を利用した発話内容の認識,いわゆる読唇に関する研究は,1980年代後半より取り組まれている.音声認識では,周囲の雑音の影響により認識率の低下を招く問題がある.一方,視覚情報は雑音の影響を含まれず,高騒音下での認識が可能となる利点をもつ.しかし,読唇は音声認識に比べ報告例が少なく認識率が低い.この問題を解決するために,講演者らはフレーム毎に計測される特徴量の時間的変化を空間上にプロットし,軌道として表現するトラジェクトリ特徴量を提案した.さらに唇および口内領域形状に着目し,これまで提案されてきた手法に比べ高い認識率を得られることを,比較実験を通して確認した.本講演では,講演者がこれまで取り組んできた読唇に関して,単音認識および単語認識について紹介する. |