講演名 2012-09-02
映像のセマンティックインデクシングのためのq-混合ガウス分布(テーマセッション,コンピュータビジョンとパターン認識のための機械学習及び企業ニーズセッション)
井上 中順, 篠田 浩一,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 近年,Bag-of-visual-words(BoW)法を確i率的枠組みに発展させた混合ガウス分布(Gaussian mixture models;GMMs)が,映像のセマンティックインデクシングにおいて,映像から抽出された局所特徴の分布の表現に効果的であることが報告されている.ガウス分布はBoltzmann-Shannonエントロピーを最大化する確率分布として導出されるが,物理学における複雑系の分野では,Boltzmann-Shannonエントロピーを一般化したTsallisエントロピー[9]から導出されるq一ガウス分布が,マルチフラクタルなどのモデルの表現に効果的であることが示されている.q一ガウス分布は,q値により分布の裾の長さを変化させることができ,2次よりも高次なモーメントを調節できるため,外れ値に対する頑健性の向上が期待される.そこで,本研究では,q一ガウス分布の混合モデルであるq一混合ガウス分布を提案し,映像と画像のセマンティックインデクシングにおけるその有用性を示す.評価実験は,TRECVID 2010 SemanticIndexingデータセットとPASCAL VOC 2010データセットで行い,評価尺度のMean Average Precisionはそれぞれのデv・一・タセットで,10.9%,49.4%となり,通常のGMMを用いた場合よりも高い精度を示した.
抄録(英) Gaussian mixture models (GMMs) which extend the bag-of-visual-words (BoW) to a probabilistic framework have been proved to be effective for image and video semantic indexing. Recently, the q-Gaussian distribution,which is derived in the non-extensive statistics, has been shown to be useful for representing patterns in manycomplex systems in physics such as fractals and cosmology. We propose q-Gaussian mixture models (q-GMMs),which are mixture models of q-Gaussian distributions, for image and video semantic indexing. It has a parameterq to control its tail-heaviness. The long-tailed distributions obtained for q > 1 are expected to effectively representcomplexly correlated data, and hence, to improve robustness against outliers. In our experiments, our proposedmethod outperformed the BoW method and achieved 49.4% and 10.9% in Mean Average Precision on the PASCALVOC 2010 dataset and the TRECVID 2010 Semantic Indexing dataset, respectively.
キーワード(和) 映像検索 / セマンテイックインデクシング / 混合ガウス分布
キーワード(英) video search / semantic indexing / Gaussian mixture model
資料番号 PRMU2012-34,IBISML2012-17
発行日

研究会情報
研究会 PRMU
開催期間 2012/8/26(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Pattern Recognition and Media Understanding (PRMU)
本文の言語 JPN
タイトル(和) 映像のセマンティックインデクシングのためのq-混合ガウス分布(テーマセッション,コンピュータビジョンとパターン認識のための機械学習及び企業ニーズセッション)
サブタイトル(和)
タイトル(英) q-Gaussian Mixture Models for Video Semantic Indexing
サブタイトル(和)
キーワード(1)(和/英) 映像検索 / video search
キーワード(2)(和/英) セマンテイックインデクシング / semantic indexing
キーワード(3)(和/英) 混合ガウス分布 / Gaussian mixture model
第 1 著者 氏名(和/英) 井上 中順 / Nakamasa INOUE
第 1 著者 所属(和/英) 東京工業大学大学院情報理工学研究科計算工学専攻
Department of Computer Science Tokyo Institute of Technology
第 2 著者 氏名(和/英) 篠田 浩一 / Koichi SHINODA
第 2 著者 所属(和/英) 東京工業大学大学院情報理工学研究科計算工学専攻
Department of Computer Science Tokyo Institute of Technology
発表年月日 2012-09-02
資料番号 PRMU2012-34,IBISML2012-17
巻番号(vol) vol.112
号番号(no) 197
ページ範囲 pp.-
ページ数 6
発行日