講演名 | 2007-03-16 Web文書を用いたニュース映像の意味的なインデクシング(一般セッション4(映像処理1),文字・文書の認識・理解) 長田 秀信, 森本 正志, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 本稿では、Web記事と放送映像との対応付けによる意味的なインデクシング方法を提案する。Web記事と放送映像は共に現実世界の事象を表すメディアであり、同時期に放送・配信されるトピックに共起が見られる。そこで提案手法では、放送映像の部分区間に対し、同様の内容を含むWeb上の記事を自動的に対応付ける。本研究では、放送映像へのクローズドキャプション等の文字列の付与を仮定しない。本研究では、放送映像とWeb記事を、それぞれ音響モデルと仮名の発音ルールを用いて音素記号からなるシンボル列に変換する。そして、シンボル列の類似度を誤りを許容するパターンマツチに基づいて評価し、放送映像とWeb記事とを対応付ける。また、放送映像に対応付けられるWeb記事の配信日時およびインデクシングの粒度は、それぞれWeb記事とニュース映像の配信時間のずれに関する調査およびニュース映像の話題分析に基づいて経験的に定める。およそ71分のニュース番組を用いて評価実験を行い、`およそ60%の長さに相当する部分に対し正しくインデクシングすることができた。 |
抄録(英) | This paper presents a novel methodology of semantic video indexing for broadcasts using the Web. Focusing on the co-occurrence of topics in broadcasts and Web articles, the methodology finds and associates semantically related parts of those broadcasts and articles. Text-based metadata such as closed captions were not used in our method. Instead, using an acoustic model, we extracted a set of multiple sequences of low-level phonetic symbols both from broadcast speech sound and words in Web articles and measured their similarity by error tolerant similarity score. Heuristic parameters for indexing resolution and number of target articles were derived by analyses of broadcasts and Web articles. In the evaluation, approximately 60% of 71 min of actual broadcast news videos were successfully indexed. |
キーワード(和) | 映像インデクシング / セマンティック / Web / メタデータ |
キーワード(英) | video indexing / semantics / Web / metadata |
資料番号 | PRMU2006-258 |
発行日 |
研究会情報 | |
研究会 | PRMU |
---|---|
開催期間 | 2007/3/9(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Pattern Recognition and Media Understanding (PRMU) |
---|---|
本文の言語 | JPN |
タイトル(和) | Web文書を用いたニュース映像の意味的なインデクシング(一般セッション4(映像処理1),文字・文書の認識・理解) |
サブタイトル(和) | |
タイトル(英) | Semantic News Video Indexing Using the Web |
サブタイトル(和) | |
キーワード(1)(和/英) | 映像インデクシング / video indexing |
キーワード(2)(和/英) | セマンティック / semantics |
キーワード(3)(和/英) | Web / Web |
キーワード(4)(和/英) | メタデータ / metadata |
第 1 著者 氏名(和/英) | 長田 秀信 / Hidenobu NAGATA |
第 1 著者 所属(和/英) | (株)日本電信電話NTTサイバーソリューション研究所 NTT Cyber Solutions Laboratories, NTT-Corporation |
第 2 著者 氏名(和/英) | 森本 正志 / Masashi MORIMOTO |
第 2 著者 所属(和/英) | (株)日本電信電話NTTサイバーソリューション研究所 NTT Cyber Solutions Laboratories, NTT-Corporation |
発表年月日 | 2007-03-16 |
資料番号 | PRMU2006-258 |
巻番号(vol) | vol.106 |
号番号(no) | 606 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |