講演名 2011-02-17
マルチモーダル・マルチフレームな手法を用いたTRECVIDセマンティックインデクシング(テーマセッション,映像処理とTRECVID)
井上 中順, 上嶋 勇祐, 篠田 浩一,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿では,我々の提案するマルチモーダル・マルチフレームなセマンティックインデクシング手法の,TRECVID 2010ワークショップにおける評価結果を報告する.セマンティックインデクシングの目的は,映像の中から「人が歌っている」・「飛行機が飛んでいる」など,意味を特った場面を検出することであり,様々な検出対象に対応できる汎用的なシステムが求められる.提案手法は,単純かつ高精度な検出器を目指し,画像特徴のSIFT特徴と音響特徴のMFCC特徴をGaussian Mixture Model (GMM) supervectorによりモデル化したマルチモーダルな手法である.SIFT特徴をショット中の複数のフレームから抽出を行うことで検出精度の向上を図った.TRECVID 2010のデータセットで評価実験を行った結果,総合評価のMean Inferred Average Precisionは7.36%となった.
抄録(英) We propose a multi-modal, multi-frame approach for semantic indexing in the TRECVID 2010 workshop. The goal of the semantic indexing is to develop a method for indexing many concepts that will be useful for video search. In this study, we implement a simple and accurate system by using Gaussian Mixture Model (GMM) supervectors with SIFT and MFCC features. The SIFT features are extracted not only from key-frames but also from many image frames in a shot in order to get the most out of multi-frame information. Our best result on the TRECVID 2010 dataset was 7.36% in terms of Mean Inferred Average Precision.
キーワード(和) セマンティックインデクシング / マルチモーダル / マルチフレーム / GMM Supervector
キーワード(英) Semantic Indexing / Multi-modal / Multi-frame / GMM Supervector
資料番号 PRMU2010-212
発行日

研究会情報
研究会 PRMU
開催期間 2011/2/10(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Pattern Recognition and Media Understanding (PRMU)
本文の言語 JPN
タイトル(和) マルチモーダル・マルチフレームな手法を用いたTRECVIDセマンティックインデクシング(テーマセッション,映像処理とTRECVID)
サブタイトル(和)
タイトル(英) A Multi-modal, Multi-frame Approach for Semantic Indexing in TRECVID
サブタイトル(和)
キーワード(1)(和/英) セマンティックインデクシング / Semantic Indexing
キーワード(2)(和/英) マルチモーダル / Multi-modal
キーワード(3)(和/英) マルチフレーム / Multi-frame
キーワード(4)(和/英) GMM Supervector / GMM Supervector
第 1 著者 氏名(和/英) 井上 中順 / Nakamasa INOUE
第 1 著者 所属(和/英) 東京工業大学大学院情報理工学研究科計算工学専攻
Department of Computer Sience, Tokyo Institute of Technology
第 2 著者 氏名(和/英) 上嶋 勇祐 / Yusuke KAMISHIMA
第 2 著者 所属(和/英) 東京工業大学情報工学科
Department of Computer Sience, Tokyo Institute of Technology
第 3 著者 氏名(和/英) 篠田 浩一 / Koichi SHINODA
第 3 著者 所属(和/英) 東京工業大学大学院情報理工学研究科計算工学専攻
Department of Computer Sience, Tokyo Institute of Technology
発表年月日 2011-02-17
資料番号 PRMU2010-212
巻番号(vol) vol.110
号番号(no) 414
ページ範囲 pp.-
ページ数 6
発行日