講演抄録/キーワード |
講演名 |
2011-02-17 13:50
マルチモーダル・マルチフレームな手法を用いたTRECVIDセマンティックインデクシング ○井上中順・上嶋勇祐・篠田浩一(東工大) PRMU2010-212 |
抄録 |
(和) |
本稿では,我々の提案するマルチモーダル・マルチフレームなセマンティックインデクシング手法の,TRECVID 2010ワークショップにおける評価結果を報告する.セマンティックインデクシングの目的は,映像の中から「人が歌っている」・「飛行機が飛んでいる」など,意味を持った場面を検出することであり,様々な検出対象に対応できる汎用的なシステムが求められる.提案手法は,単純かつ高精度な検出器を目指し,画像特徴のSIFT特徴と音響特徴のMFCC特徴をGaussian Mixture Model (GMM) supervectorによりモデル化したマルチモーダルな手法である.SIFT特徴をショット中の複数のフレームから抽出を行うことで検出精度の向上を図った.TRECVID 2010のデータセットで評価実験を行った結果,総合評価のMean Inferred Average Precisionは7.36%となった. |
(英) |
We propose a multi-modal, multi-frame approach for semantic indexing in the TRECVID 2010 workshop. The goal of the semantic indexing is to develop a method for indexing many concepts that will be useful for video search. In this study, we implement a simple and accurate system by using Gaussian Mixture Model (GMM) supervectors with SIFT and MFCC features. The SIFT features are extracted not only from key-frames but also from many image frames in a shot in order to get the most out of multi-frame information. Our best result on the TRECVID 2010 dataset was 7.36% in terms of Mean Inferred Average Precision. |
キーワード |
(和) |
セマンティックインデクシング / マルチモーダル / マルチフレーム / GMM Supervector / / / / |
(英) |
Semantic Indexing / Multi-modal / Multi-frame / GMM Supervector / / / / |
文献情報 |
信学技報, vol. 110, no. 414, PRMU2010-212, pp. 25-30, 2011年2月. |
資料番号 |
PRMU2010-212 |
発行日 |
2011-02-10 (PRMU) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
PRMU2010-212 |
研究会情報 |
研究会 |
PRMU |
開催期間 |
2011-02-17 - 2011-02-18 |
開催地(和) |
埼玉大 |
開催地(英) |
|
テーマ(和) |
映像処理とTRECVID |
テーマ(英) |
|
講演論文情報の詳細 |
申込み研究会 |
PRMU |
会議コード |
2011-02-PRMU |
本文の言語 |
日本語 |
タイトル(和) |
マルチモーダル・マルチフレームな手法を用いたTRECVIDセマンティックインデクシング |
サブタイトル(和) |
|
タイトル(英) |
A Multi-modal, Multi-frame Approach for Semantic Indexing in TRECVID |
サブタイトル(英) |
|
キーワード(1)(和/英) |
セマンティックインデクシング / Semantic Indexing |
キーワード(2)(和/英) |
マルチモーダル / Multi-modal |
キーワード(3)(和/英) |
マルチフレーム / Multi-frame |
キーワード(4)(和/英) |
GMM Supervector / GMM Supervector |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
井上 中順 / Nakamasa Inoue / イノウエ ナカマサ |
第1著者 所属(和/英) |
東京工業大学 (略称: 東工大)
Tokyo Institute of Technology (略称: Tokyo Tech) |
第2著者 氏名(和/英/ヨミ) |
上嶋 勇祐 / Yusuke Kamishima / カミシマ ユウスケ |
第2著者 所属(和/英) |
東京工業大学 (略称: 東工大)
Tokyo Institute of Technology (略称: Tokyo Tech) |
第3著者 氏名(和/英/ヨミ) |
篠田 浩一 / Koichi Shinoda / シノダ コウイチ |
第3著者 所属(和/英) |
東京工業大学 (略称: 東工大)
Tokyo Institute of Technology (略称: Tokyo Tech) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2011-02-17 13:50:00 |
発表時間 |
30分 |
申込先研究会 |
PRMU |
資料番号 |
PRMU2010-212 |
巻番号(vol) |
vol.110 |
号番号(no) |
no.414 |
ページ範囲 |
pp.25-30 |
ページ数 |
6 |
発行日 |
2011-02-10 (PRMU) |