講演名 | 2011-02-17 マルチモーダル・マルチフレームな手法を用いたTRECVIDセマンティックインデクシング(テーマセッション,映像処理とTRECVID) 井上 中順, 上嶋 勇祐, 篠田 浩一, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 本稿では,我々の提案するマルチモーダル・マルチフレームなセマンティックインデクシング手法の,TRECVID 2010ワークショップにおける評価結果を報告する.セマンティックインデクシングの目的は,映像の中から「人が歌っている」・「飛行機が飛んでいる」など,意味を特った場面を検出することであり,様々な検出対象に対応できる汎用的なシステムが求められる.提案手法は,単純かつ高精度な検出器を目指し,画像特徴のSIFT特徴と音響特徴のMFCC特徴をGaussian Mixture Model (GMM) supervectorによりモデル化したマルチモーダルな手法である.SIFT特徴をショット中の複数のフレームから抽出を行うことで検出精度の向上を図った.TRECVID 2010のデータセットで評価実験を行った結果,総合評価のMean Inferred Average Precisionは7.36%となった. |
抄録(英) | We propose a multi-modal, multi-frame approach for semantic indexing in the TRECVID 2010 workshop. The goal of the semantic indexing is to develop a method for indexing many concepts that will be useful for video search. In this study, we implement a simple and accurate system by using Gaussian Mixture Model (GMM) supervectors with SIFT and MFCC features. The SIFT features are extracted not only from key-frames but also from many image frames in a shot in order to get the most out of multi-frame information. Our best result on the TRECVID 2010 dataset was 7.36% in terms of Mean Inferred Average Precision. |
キーワード(和) | セマンティックインデクシング / マルチモーダル / マルチフレーム / GMM Supervector |
キーワード(英) | Semantic Indexing / Multi-modal / Multi-frame / GMM Supervector |
資料番号 | PRMU2010-212 |
発行日 |
研究会情報 | |
研究会 | PRMU |
---|---|
開催期間 | 2011/2/10(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Pattern Recognition and Media Understanding (PRMU) |
---|---|
本文の言語 | JPN |
タイトル(和) | マルチモーダル・マルチフレームな手法を用いたTRECVIDセマンティックインデクシング(テーマセッション,映像処理とTRECVID) |
サブタイトル(和) | |
タイトル(英) | A Multi-modal, Multi-frame Approach for Semantic Indexing in TRECVID |
サブタイトル(和) | |
キーワード(1)(和/英) | セマンティックインデクシング / Semantic Indexing |
キーワード(2)(和/英) | マルチモーダル / Multi-modal |
キーワード(3)(和/英) | マルチフレーム / Multi-frame |
キーワード(4)(和/英) | GMM Supervector / GMM Supervector |
第 1 著者 氏名(和/英) | 井上 中順 / Nakamasa INOUE |
第 1 著者 所属(和/英) | 東京工業大学大学院情報理工学研究科計算工学専攻 Department of Computer Sience, Tokyo Institute of Technology |
第 2 著者 氏名(和/英) | 上嶋 勇祐 / Yusuke KAMISHIMA |
第 2 著者 所属(和/英) | 東京工業大学情報工学科 Department of Computer Sience, Tokyo Institute of Technology |
第 3 著者 氏名(和/英) | 篠田 浩一 / Koichi SHINODA |
第 3 著者 所属(和/英) | 東京工業大学大学院情報理工学研究科計算工学専攻 Department of Computer Sience, Tokyo Institute of Technology |
発表年月日 | 2011-02-17 |
資料番号 | PRMU2010-212 |
巻番号(vol) | vol.110 |
号番号(no) | 414 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |