講演名 2010-10-08
連続DPマッチングを用いた発話シーンからの単語スポッティング認識(一般セッション,福祉と見守りのための画像・音声処理)
齊藤 剛史, 内田 克彦, 小西 亮介,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本論文は読唇技術においてこれまで試みられていない文章発話シーンに対する単語スポッティング認識に取り組む.読唇に関する研究は数多くなされているが,認識対象は単音あるいは単語の発話シーンであり,文章の発話シーンを対象とした研究報告はない.本論文では先行研究である単語読唇で提案した特徴量を用いて,連続DPマッチングを用いたスポッティング認識を適用する.新聞記事29文を処理対象とし,出現頻度の高い16語を認識対象に設定した.5人の発話者の発話シーンを撮影し,認識実験を行なった結果,平均認識率46%を得た.認識対象16語の発話時間と認識結果の相関を調べると,発話時間の短い単語ほど間違えられやすい傾向があることがわかった.次に認識に用いた参照パターンを用いて単語読唇を行った結果,85%の認識率を得た.また両認識結果は単語に関して相関があることを確認した.
抄録(英) This paper addresses the word spotting recognition to the text utterance scene which is not proposed in lip reading method until now. Although many researchers have proposed recognition method for a single sound or a word, there is no research for a text. In this paper, we use shape features which proposed in previous research, and apply the spotting recognition using continuous DP matching. We set 29 sentences from newspaper article and select 16 words with high frequency for recognition. With five subjects, we obtained an average recognition rate of 46%. As a result of investigating correlation between a recognition result and utterance time, it was found that there is a tendency for the shorter word is easy to be mistaken. Moreover, we carried out word lip reading with reference patterns, and obtained an average recognition rate of 85%. We confirmed that both recognition results had correlation about a word.
キーワード(和) 読唇 / スポッティング認識 / 連続DPマッチング / 文章発話シーン
キーワード(英) Lip reading / spotting recognition / continuous DP matching / text utterance scene
資料番号 PRMU2010-98,SP2010-54,WIT2010-42
発行日

研究会情報
研究会 WIT
開催期間 2010/10/1(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Well-being Information Technology(WIT)
本文の言語 JPN
タイトル(和) 連続DPマッチングを用いた発話シーンからの単語スポッティング認識(一般セッション,福祉と見守りのための画像・音声処理)
サブタイトル(和)
タイトル(英) Word Spotting Recognition to the Text Utterance Scene using Continuous DP Matching
サブタイトル(和)
キーワード(1)(和/英) 読唇 / Lip reading
キーワード(2)(和/英) スポッティング認識 / spotting recognition
キーワード(3)(和/英) 連続DPマッチング / continuous DP matching
キーワード(4)(和/英) 文章発話シーン / text utterance scene
第 1 著者 氏名(和/英) 齊藤 剛史 / Takeshi SAITOH
第 1 著者 所属(和/英) 九州工業大学大学院情報工学研究院
Kyushu Institute of Technology
第 2 著者 氏名(和/英) 内田 克彦 / Katsuhiko UCHIDA
第 2 著者 所属(和/英) 鳥取大学大学院工学研究科
Tottori University
第 3 著者 氏名(和/英) 小西 亮介 / Ryosuke KONISHI
第 3 著者 所属(和/英) 鳥取大学大学院工学研究科
Tottori University
発表年月日 2010-10-08
資料番号 PRMU2010-98,SP2010-54,WIT2010-42
巻番号(vol) vol.110
号番号(no) 221
ページ範囲 pp.-
ページ数 6
発行日