講演抄録/キーワード |
講演名 |
2010-10-08 15:20
連続DPマッチングを用いた発話シーンからの単語スポッティング認識 ○齊藤剛史(九工大)・内田克彦・小西亮介(鳥取大) PRMU2010-98 SP2010-54 WIT2010-42 |
抄録 |
(和) |
本論文は読唇技術においてこれまで試みられていない文章発話シーンに対する単語スポッティング認識に取り組む.読唇に関する研究は数多くなされているが,認識対象は単音あるいは単語の発話シーンであり,文章の発話シーンを対象とした研究報告はない.本論文では先行研究である単語読唇で提案した特徴量を用いて,連続DPマッチングを用いたスポッティング認識を適用する.新聞記事29文を処理対象とし,出現頻度の高い16語を認識対象に設定した.5人の発話者の発話シーンを撮影し,認識実験を行なった結果,平均認識率46%を得た.認識対象16語の発話時間と認識結果の相関を調べると,発話時間の短い単語ほど間違えられやすい傾向があることがわかった.次に認識に用いた参照パターンを用いて単語読唇を行った結果,85%の認識率を得た.また両認識結果は単語に関して相関があることを確認した. |
(英) |
This paper addresses the word spotting recognition to the text utterance scene which is not proposed in lip reading method until now. Although many researchers have proposed recognition method for a single sound or a word, there is no research for a text. In this paper, we use shape features which proposed in previous research, and apply the spotting recognition using continuous DP matching. We set 29 sentences from newspaper article and select 16 words with high frequency for recognition. With ve subjects, we obtained an average recognition rate of 46%. As a result of investigating correlation between a recognition result and utterance time, it was found that there is a tendency for the shorter word is easy to be mistaken. Moreover, we carried out word lip reading with reference patterns, and obtained an average recognition rate of 85%. We conrmed that both recognition results had correlation about a word. |
キーワード |
(和) |
読唇 / スポッティング認識 / 連続DPマッチング / 文章発話シーン / / / / |
(英) |
lip reading / spotting recognition / continuous DP matching / text utterance scene / / / / |
文献情報 |
信学技報, vol. 110, no. 219, PRMU2010-98, pp. 53-58, 2010年10月. |
資料番号 |
PRMU2010-98 |
発行日 |
2010-10-01 (PRMU, SP, WIT) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
PRMU2010-98 SP2010-54 WIT2010-42 |
研究会情報 |
研究会 |
PRMU SP WIT |
開催期間 |
2010-10-08 - 2010-10-09 |
開催地(和) |
幕張メッセ(CEATEC会場) |
開催地(英) |
|
テーマ(和) |
福祉と見守りのための画像・音声処理 |
テーマ(英) |
|
講演論文情報の詳細 |
申込み研究会 |
PRMU |
会議コード |
2010-10-PRMU-SP-WIT |
本文の言語 |
日本語 |
タイトル(和) |
連続DPマッチングを用いた発話シーンからの単語スポッティング認識 |
サブタイトル(和) |
|
タイトル(英) |
Word Spotting Recognition to the Text Utterance Scene using Continuous DP Matching |
サブタイトル(英) |
|
キーワード(1)(和/英) |
読唇 / lip reading |
キーワード(2)(和/英) |
スポッティング認識 / spotting recognition |
キーワード(3)(和/英) |
連続DPマッチング / continuous DP matching |
キーワード(4)(和/英) |
文章発話シーン / text utterance scene |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
齊藤 剛史 / Takeshi Saitoh / サイトウ タケシ |
第1著者 所属(和/英) |
九州工業大学 (略称: 九工大)
Kyushu Institute of Technology (略称: Kyushu Inst. of Tech.) |
第2著者 氏名(和/英/ヨミ) |
内田 克彦 / Katsuhiko Uchida / ウチダ カツヒコ |
第2著者 所属(和/英) |
鳥取大学 (略称: 鳥取大)
Tottori University (略称: Tottori Univ.) |
第3著者 氏名(和/英/ヨミ) |
小西 亮介 / Ryosuke Konishi / コニシ リョウスケ |
第3著者 所属(和/英) |
鳥取大学 (略称: 鳥取大)
Tottori University (略称: Tottori Univ.) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2010-10-08 15:20:00 |
発表時間 |
30分 |
申込先研究会 |
PRMU |
資料番号 |
PRMU2010-98, SP2010-54, WIT2010-42 |
巻番号(vol) |
vol.110 |
号番号(no) |
no.219(PRMU), no.220(SP), no.221(WIT) |
ページ範囲 |
pp.53-58 |
ページ数 |
6 |
発行日 |
2010-10-01 (PRMU, SP, WIT) |
|