講演名 2014-03-13
高速な画像分類のためのNeighbor-to-Neighbor探索(テーマセッション,パターン認識・メディア理解における組み合わせと統合,文化の振興と教育)
井上 中順, 篠田 浩一,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 高速な画像分類のためのNeighbor-to-Neighbor(NTN)探索を提案する.NTN探索は,ベクトル量子化および混合ガウス分布の確率計算の計算量削減を行うアルゴリズムであり,近年注目されている,Bag-of-visual-wordsやFisher vectorを用いた画像分類の高速化が可能となる.NTN探索は入力となる各特徴量に対して,その近傍が定義されていることを仮定し,類似した特徴量を近傍から近傍へと探索して,特徴量の類似度に応じて計算を省略することで高速化を実現する.例えば,Dense samplingによって,格子点上から密に抽出されたSIFT特徴量に対してNTN探索を適用する場合,各SIFT特徴量に関して上下左右に隣接した点上のSIFT特徴量の集合を近傍と考えることで,類似したSIFT特徴量を隣から隣へと探索しつつベクトル量子化や混合ガウス分布に関する計算を高速に行うことができる.PASCAL VOC 2007 Classification Challengeにおける本手法の評価実験では,NTN探索の導入により,検出精度を保った状態で,ベクトル量子化および混合ガウス分布に関してそれぞれ77.4%,89.3%の計算量削減を実現した.
抄録(英) We propose Neighbor-to-Neighbor (NTN) search for fast image classification. The NTN search reduces computational cost of vector quantization (VQ) and Gaussian mixture models (GMMs) in image classification frame-works such as bag-of-visual-words and Fisher vector. The NTN search finds similar input vectors from a neighbor vector to a neighbor vector to skip some calculations based on the similarity of the input vectors. For example, in dense SIFT, the NTN search seeks similar descriptors from an adjacent descriptor to the other adjacent descriptors. We evaluated our method on the PASCAL VOC 2007 classification challenge task. The NTN search for VQ reduced the computational cost by 77.4%, and the NTN search for GMM reduced it by 89.3%, without any significant degradation in classification performance.
キーワード(和) 画像分類 / 混合ガウス分布 / Bag-of-visual-words
キーワード(英) Image Classification / Gaussian Mixture Models / Bag-of-visual-words
資料番号 PRMU2013-184
発行日

研究会情報
研究会 PRMU
開催期間 2014/3/6(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Pattern Recognition and Media Understanding (PRMU)
本文の言語 JPN
タイトル(和) 高速な画像分類のためのNeighbor-to-Neighbor探索(テーマセッション,パターン認識・メディア理解における組み合わせと統合,文化の振興と教育)
サブタイトル(和)
タイトル(英) Neighbor-to-Neighbor Search for Fast Image Classification
サブタイトル(和)
キーワード(1)(和/英) 画像分類 / Image Classification
キーワード(2)(和/英) 混合ガウス分布 / Gaussian Mixture Models
キーワード(3)(和/英) Bag-of-visual-words / Bag-of-visual-words
第 1 著者 氏名(和/英) 井上 中順 / Nakamasa INOUE
第 1 著者 所属(和/英) 東京工業大学大学院情報理工学研究科計算工学専攻
Department of Computer Science, Tokyo Institute of Technology
第 2 著者 氏名(和/英) 篠田 浩一 / Koichi SHINODA
第 2 著者 所属(和/英) 東京工業大学大学院情報理工学研究科計算工学専攻
Department of Computer Science, Tokyo Institute of Technology
発表年月日 2014-03-13
資料番号 PRMU2013-184
巻番号(vol) vol.113
号番号(no) 493
ページ範囲 pp.-
ページ数 6
発行日