講演抄録/キーワード |
講演名 |
2009-11-26 11:10
Web画像と文章の大域的特徴から得る潜在的意味に基づくデータ検索 ~ Web上での一般画像認識実現への新たなアプローチを目指して ~ ○牛久祥孝・中山英樹(東大)・原田達也(東大/JST)・國吉康夫(東大) PRMU2009-100 |
抄録 |
(和) |
汎用的な一般画像認識の実現の為には大量の学習データが必要となるため,近年ではWeb上の膨大な画像を用いて自律的に学習を行う手法が盛んに研究されている.本研究では,Web画像に対して潜在的な意味の近い画像を検索し,それらに付随する複数の文章から一般画像認識を行う枠組みを考え,その検索に関する基本的な手法を提案する.本論文では,Web画像と文章から大域的に抽出された特徴量から潜在変数を獲得し,その情報量を反映するメトリックに基づいて近傍検索を行う事でこの検索を実現する.提案手法は画像特徴・文章特徴の確率的正準相関分析に基づくため,大量なデータでも破綻せずに学習を行う事が可能である.ニュースサイトから収集したデータセットに提案手法を適用することで,本論文の提案する手法の優位性を示す. |
(英) |
In these days, methods for generic image recognition are actively researched. Many works use web images as training data because a large amount of data is necessary for its realization. In this paper, we consider describing an input image using texts associated with the images which have similar latent meaning. This is realized by nearest search based on latent variables of global features extracted from web images and texts. Learning method based on the probabilistic canonical correlation analysis makes it possible to learn from a large amount of data. Experiments on a dataset collected from a news site show the superiority of the proposed method. |
キーワード |
(和) |
Webマイニング / 類似画像検索 / 確率的正準相関分析 / / / / / |
(英) |
Web mining / similar image search / probabilistic canonical correlation analysis / / / / / |
文献情報 |
信学技報, vol. 109, no. 306, PRMU2009-100, pp. 45-50, 2009年11月. |
資料番号 |
PRMU2009-100 |
発行日 |
2009-11-19 (PRMU) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
PRMU2009-100 |