講演抄録/キーワード |
講演名 |
2010-03-16 08:55
トラジェクトリ特徴量を利用した単語読唇に関する基礎検討 齊藤剛史・○石倉寛之・山下晃平・小西亮介(鳥取大) PRMU2009-277 HIP2009-162 |
抄録 |
(和) |
読唇に関する研究は数多くなされている.しかし,読唇は音声認識に比べ認識率が低く,様々な課題が残っている.そこで本論文では読唇の基礎検討と位置づけ,先行研究で高い認識精度を得られたトラジェクトリ特徴量を用いて,(1)読唇に有効な特徴量の検討,(2)認識単語の選び方,(3)撮影時のフレームレートの影響,(4)発話口調の影響の4項目について検討する.日本語25単語を認識対象とし,10人より発話シーンを撮影して様々な認識実験を行った.その結果,(1)認識に有効な特徴量は$S^i$,$A^i$,$S^t$であり,10人の平均認識率94.6\%を得た.(2)認識率は母音並びに影響を受ける.(3)学習時と認識時のフレームレートの差が小さい場合,認識率はあまり影響を受けない.また認識時のフレームレートを大きくする方が高い認識率が得られやすい.(4)口調の違いは認識率に影響することを2種の発話シーンを用いて確認した. |
(英) |
There have been a number of works concerned with lip reading. However, the recognition rate of lip reading is low compared with speech recognition, and various problems are remained. Then, this paper discusses four topics: (1) analysis the effective feature, (2) selection of target word, (3) analysis the influence of frame rate, and (4) analysis the influence of the utterance tone. We set Japanese 25 words as the target, and took the utterance scenes with ten speakers. As the result, we has been found that (1) the effective features are $S^i$, $A^i$, and $S^t$ and obtained the averaging recognition rate of 94.6\% with ten speakers, (2) the recognition rate was depended on the sequence of the vowel, (3) when the difference between the frame rate of the learning and recognition is small, the recognition rate was not influence, (4) the clearly utterance is effect. |
キーワード |
(和) |
単語読唇 / トラジェクトリ特徴量 / 基礎実験 / フレームレート / 口調 / / / |
(英) |
Word lip reading / trajectory feature / fundamental experiment / frame rate / utterance tone / / / |
文献情報 |
信学技報, vol. 109, no. 470, PRMU2009-277, pp. 259-264, 2010年3月. |
資料番号 |
PRMU2009-277 |
発行日 |
2010-03-08 (PRMU, HIP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
PRMU2009-277 HIP2009-162 |
|