講演名 2002/12/12
自動読唇における分析フレーム間隔および画像解像度に関する調査
加藤 秀和, 李 晃伸, 猿渡 洋, 鹿野 清宏,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 機械に唇の動きから発話内容を理解させる自動読唇は,音声認識における耐雑音手法の一つとしても注目され,近年盛んに研究が行われるようになった.しかし,未だ十分な性能が報告されておらず,認識性能の改善が望まれている.これまで,特微量に関する評価実験はいくつか報告されているが,分析フレーム間隔や画像解像度に関する調査は十分ではない.そこで本研究では,分析フレーム間隔や画像解像度が認識性能を左右する要因であると考え,それらの関係について実験を行い調査した.分析フレーム間隔と認識性能の関係を,高速度カメラで撮影した画像を用いて分析フレーム間隔を様々に変化させることにより調査した.その結果,分析フレーム間隔は認識性能に大きく関わっており,分析フレーム間隔を短くすることで認識性能の改善につながることがわかった.画像解像度と認識性能の関係を様々な大きさの画像を用いた認識実験により調査した結果,本研究で用いたイメージベース法によって得られる特徴量においては,解像度を変化させても認識率は,ほぼ一定であった.
抄録(英) Automatic lip-reading research using the video sequence of the speaker's mouth has been carried out with significant interests in increasing the robustness of automatic speech recognition in noisy environments. However, it has not accomplished enough recognition rate yet. In this paper, we investigate the relationship of analysis frame interval and image resolution to check how they take effects on the lip-reading performance. Based on the experimental results under various analysis frame interval using the video sequence recorded by high speed camera, we make clean that it is effective to use the faster frame rate for high recognition performance. Another experimental results under various image resolution shows that the recognition performance does not depend on the image resolution. These results suggest that the visual feature vector extracted by our image based approach can reduce the resolution to 20 × 15 pix cells.
キーワード(和) 自動読唇 / 分析フレーム間隔 / 画像解像度 / イメージベース法
キーワード(英) Automatic Lip-Reading / Analysis Frame Interval / Image Resolution / Image based Method
資料番号 SP2002-142
発行日

研究会情報
研究会 SP
開催期間 2002/12/12(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) 自動読唇における分析フレーム間隔および画像解像度に関する調査
サブタイトル(和)
タイトル(英) Relationship of Analysis Frame Interval and Image Resolution in Automatic Lip-Reading Recognition Performance
サブタイトル(和)
キーワード(1)(和/英) 自動読唇 / Automatic Lip-Reading
キーワード(2)(和/英) 分析フレーム間隔 / Analysis Frame Interval
キーワード(3)(和/英) 画像解像度 / Image Resolution
キーワード(4)(和/英) イメージベース法 / Image based Method
第 1 著者 氏名(和/英) 加藤 秀和 / Hidekazu KATO
第 1 著者 所属(和/英) 奈良先端科学技術大学院大学情報科学研究科
Graduate School of Information Science, Nara Institute of Science and Technology
第 2 著者 氏名(和/英) 李 晃伸 / Akinobu LEE
第 2 著者 所属(和/英) 奈良先端科学技術大学院大学情報科学研究科
Graduate School of Information Science, Nara Institute of Science and Technology
第 3 著者 氏名(和/英) 猿渡 洋 / Hiroshi SARUWATARI
第 3 著者 所属(和/英) 奈良先端科学技術大学院大学情報科学研究科
Graduate School of Information Science, Nara Institute of Science and Technology
第 4 著者 氏名(和/英) 鹿野 清宏 / Kiyohiro SHIKANO
第 4 著者 所属(和/英) 奈良先端科学技術大学院大学情報科学研究科
Graduate School of Information Science, Nara Institute of Science and Technology
発表年月日 2002/12/12
資料番号 SP2002-142
巻番号(vol) vol.102
号番号(no) 529
ページ範囲 pp.-
ページ数 6
発行日