講演名 2012-09-03
混合ガウスモデルを用いた自動画像アノテーション手法に対する ノンパラメトリックベイズモデルの適用(テーマセッション,コンピュータビジョンとパターン認識のための機械学習及び企業ニーズセッション)
坪下 幸寛, 加藤 典司, 岡田 真人,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 自動画像アノテーション(Automatic Image Annotation:AIA)とは,キャプション,キーワードという形で,デジタル画像に自動的にメタデータを付与する処理のことである.本レポートでは,混合ガウス分布モデル(Gaussian mixtUre model:GMM)を確率モデルとして用いたAIAアルゴリズムの改善に対する取り組みに関して報告する.GMMを確率モデルとして用いているAIAの代表的な従来手法であるSupervised Multiclass Labeling(SML)では,GMMの混合要素数は全てのラベルに対して一律に与えられているのみであった.GMMの性能は,いくつのガウス分布を重ね合わせるかを定める混合要素数に大きく依存することが知られている.そこ本研究では,混合要素数も事前に定めず,それぞれのラベルに対して与えられた学習データから最適な値を学習させることを試みた.具体的には,混合要素の生成過程として,ノンパラメトリックなベイズ推定モデルであるDirichlet Processを導入した.自動画像アノテーションの標準的なテストコレクションCorel 5K画像データベースによる評価を行った結果,提案手法は,従来モデルと比較して,安定した性能を示すことが分かった.
抄録(英) Automatic image annotation (AIA) is a process to automatically assign metadata to a digital image in the form of captions or keywords. Here we reported the effort of the improvement with respect to a learning based AIA algorithm using Gaussian mixture model (GMM) as a probabilistic model. In Supervised Multiclass Labeling (SML), which is a conventional method to use GMM, the number of mixed components is identical to all labels. The performance of GMM is known to fully depend on the number of mixed component. Therefore, in the present study, the number of components not being determined in advance, we tried to make the GMM to learn the optimal number of components from given training data. More precisely, we introduced the GMM to Dirichlet process, which is commonly used in the nonparametric Bayesian estimation, as a generating process of mixed components. As the result of evaluation tests using Corel 5K database, which is a standard test collection for image annotation, we found the proposed method exhibited more stable performance than the standard SML.
キーワード(和) 自動画像アノテーション / 機械学習 / 混合ガウスモデル / ノンパラメトリックベイズ
キーワード(英) Automatic image annotation / Machine learning / Gaussian mixture model / Nonparametric Bayesian model
資料番号 PRMU2012-40,IBISML2012-23
発行日

研究会情報
研究会 PRMU
開催期間 2012/8/26(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Pattern Recognition and Media Understanding (PRMU)
本文の言語 JPN
タイトル(和) 混合ガウスモデルを用いた自動画像アノテーション手法に対する ノンパラメトリックベイズモデルの適用(テーマセッション,コンピュータビジョンとパターン認識のための機械学習及び企業ニーズセッション)
サブタイトル(和)
タイトル(英) Nonparametric Bayesian Estimation for Automatic Image Annotation Using Gaussian Mixture Model
サブタイトル(和)
キーワード(1)(和/英) 自動画像アノテーション / Automatic image annotation
キーワード(2)(和/英) 機械学習 / Machine learning
キーワード(3)(和/英) 混合ガウスモデル / Gaussian mixture model
キーワード(4)(和/英) ノンパラメトリックベイズ / Nonparametric Bayesian model
第 1 著者 氏名(和/英) 坪下 幸寛 / Yukihiro TSUBOSHITA
第 1 著者 所属(和/英) 富士ゼロックス株研究技術開発本部
Corporate Research Group Fuji Xerox Co. Ltd.
第 2 著者 氏名(和/英) 加藤 典司 / Noriji KATO
第 2 著者 所属(和/英) 富士ゼロックス株研究技術開発本部
Corporate Research Group Fuji Xerox Co. Ltd.
第 3 著者 氏名(和/英) 岡田 真人 / Masato OKADA
第 3 著者 所属(和/英) 東京大学新領域創成科学研究科
Graduate School of Frontier Sciences The University of Tokyo
発表年月日 2012-09-03
資料番号 PRMU2012-40,IBISML2012-23
巻番号(vol) vol.112
号番号(no) 197
ページ範囲 pp.-
ページ数 6
発行日