講演名 2011-02-17
Bag-of-Framesと時空間特徴量を用いたSemantic Indexing Taskへの取り組み(テーマセッション,映像処理とTRECVID)
下田 保志, 野口 顕嗣, 柳井 啓司,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本発表では,国際映像処理ワークショップTRECVID 2010で行われた概念索引タスク(Semantic Indexing Task)への取り組みの結果について報告する.映像中のショット動画の全フレームから特徴を抽出し,ベクトル量子化された各フレームの特徴量を要素とするBag-of-Framesを特徴量として利用した.加えて,時空間特徴,顔特徴など10種類の特徴量を抽出し,Multiple Kernel Learning(MKL)によって統合する動作認識フレームワークを用い,Airplane, Boatなど130種類の概念の認識を行った.その代表の30種類の概念についてテストした結果,MKLによる統合による結果で平均適合率infAP=0.0478を得た,これはTRECVID2010の参加者30チームの内,14位に当たる.また,10種類の概念(light category)においては37チームの内,12位となった.
抄録(英) In this paper, we describe our approach and results for the semantics indexing task at TRECVID 2010. We focused on spatio-temporal feature and Bag-of-Prames approach. We used Multiple Kernel Learning as a fusion method to combine these various kinds of features. Since MKL can estimate weights to combine kernels, as a result of the full-category SIN task, our MKL approach yielded to get infAP=0.0478 and we reached rank 14 (among 30 teams) for the full-category SIN task and rank 12 (among 37 teams) for the light-category SIN task in TRECVID 2010.
キーワード(和) 動作認識 / 時空間特徴 / MKL
キーワード(英) action recognition / spatio-temporal feature / MKL
資料番号 PRMU2010-213
発行日

研究会情報
研究会 PRMU
開催期間 2011/2/10(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Pattern Recognition and Media Understanding (PRMU)
本文の言語 JPN
タイトル(和) Bag-of-Framesと時空間特徴量を用いたSemantic Indexing Taskへの取り組み(テーマセッション,映像処理とTRECVID)
サブタイトル(和)
タイトル(英) Approach to conbine Bag-of-Frames and spatio temporal features for TRECVID2010 Semantic Indexing Task.
サブタイトル(和)
キーワード(1)(和/英) 動作認識 / action recognition
キーワード(2)(和/英) 時空間特徴 / spatio-temporal feature
キーワード(3)(和/英) MKL / MKL
第 1 著者 氏名(和/英) 下田 保志 / Yasushi SHIMODA
第 1 著者 所属(和/英) 電気通信大学大学院総合情報学専攻
Department of Informatics, The University of Electro-Communication
第 2 著者 氏名(和/英) 野口 顕嗣 / Akitsugu NOGUCHI
第 2 著者 所属(和/英) 電気通信大学大学院総合情報学専攻
Department of Informatics, The University of Electro-Communication
第 3 著者 氏名(和/英) 柳井 啓司 / Keiji YANAI
第 3 著者 所属(和/英) 電気通信大学大学院総合情報学専攻
Department of Informatics, The University of Electro-Communication
発表年月日 2011-02-17
資料番号 PRMU2010-213
巻番号(vol) vol.110
号番号(no) 414
ページ範囲 pp.-
ページ数 6
発行日