複数の画像特徴とPassive-Aggressiveを用いたfine-grained classification(一般セッション,文字・文書の認識と理解及びアルゴリズム・システム評価)

郡司 直之; 樋口 貴之; 安本 晃基; 村岡 宏是; 牛久 祥孝; 原田 達也; 國吉 康夫

講演名	2013-03-14 複数の画像特徴とPassive-Aggressiveを用いたfine-grained classification(一般セッション,文字・文書の認識と理解及びアルゴリズム・システム評価) 郡司直之, 樋口貴之, 安本晃基, 村岡宏是, 牛久祥孝, 原田達也, 國吉康夫,
PDFダウンロードページ	PDFダウンロードページへ
抄録(和)	近年,fine-grained classificationに関する研究が盛んに行われているが,一般物体認識のために開発された様々な局所記述子や,最新のコーディング手法の性能評価はほとんど行われていない.そこで本研究では,ImageNet Large Scale Visual Recognition Challenge 2012 (ILSVRC2012)fine-grained classification taskで使用されたデータセットを用いて,複数の局所記述子とFisher Vectorの評価実験を行う. dense-samplingされたSIFT記述子とFisher Vectorを用いた時のAccuracyは20.5%であったが,複数の局所記述子を組み合わせ,画像に付与されたバウンディングボックスを利用することにより最終的にAccuracyが40.6%まで上昇し,ILSVRC2012 fine-grained classification taskにおいて1位となった.また,同様のデータセットを用いて提案手法と先行研究において提案された手法の性能を比較したところ,Accuracyにおいてstate-of-the-artを超える結果が得られた.
抄録(英)	Recent years, fine-grained classification has been studied intensively. But, various local descriptors and encodings proposed for general object classification have not been applied to fine-grained classification many times. In this work, we evaluate such methods with a dataset, which was used in ImageNet Large Scale Visual Recognition Challenge (ILSVRC)2012 fine-grained classification task. When we use densely sampled SIFT descriptors and Fisher Vector, we achieve 20.5%accuracy. But, when we combine many kinds of local descriptors and utilize bounding boxes, our system yields 40.6%accuracy finally and ranks top in ILSVRC2012 fine-grained classification task. Furthermore, when we compare our system to a state-of-the-art method on a similar dataset, our system outperforms the state-of-the-art method in accuracy.
キーワード(和)	大規模画像認識 / 局所記述子 / fine-grained classification / Fisher Vector
キーワード(英)	Large-scale image classification / local descriptor / fine-grained classification / Fisher Vector
資料番号	PRMU2012-184
発行日

研究会情報
研究会	PRMU
開催期間	2013/3/7(から1日開催)
開催地（和）
開催地（英）
テーマ（和）
テーマ（英）
委員長氏名（和）
委員長氏名（英）
副委員長氏名（和）
副委員長氏名（英）
幹事氏名（和）
幹事氏名（英）
幹事補佐氏名（和）
幹事補佐氏名（英）

講演論文情報詳細
申込み研究会	Pattern Recognition and Media Understanding (PRMU)
本文の言語	JPN
タイトル（和）	複数の画像特徴とPassive-Aggressiveを用いたfine-grained classification(一般セッション,文字・文書の認識と理解及びアルゴリズム・システム評価)
サブタイトル（和）
タイトル（英）	Fine-grained classification with various local descriptors and Passive-Aggressive
サブタイトル（和）
キーワード(1)（和/英）	大規模画像認識 / Large-scale image classification
キーワード(2)（和/英）	局所記述子 / local descriptor
キーワード(3)（和/英）	fine-grained classification / fine-grained classification
キーワード(4)（和/英）	Fisher Vector / Fisher Vector
第 1 著者氏名（和/英）	郡司直之 / Naoyuki GUNJI
第 1 著者所属（和/英）	東京大学大学院情報理工学系研究科 Graduate School of Information Science and Technology, The University of Tokyo
第 2 著者氏名（和/英）	樋口貴之 / Takayuki HIGUCHI
第 2 著者所属（和/英）	東京大学大学院情報理工学系研究科 Graduate School of Information Science and Technology, The University of Tokyo
第 3 著者氏名（和/英）	安本晃基 / Koki YASUMOTO
第 3 著者所属（和/英）	東京大学大学院情報理工学系研究科 Graduate School of Information Science and Technology, The University of Tokyo
第 4 著者氏名（和/英）	村岡宏是 / Hiroshi MURAOKA
第 4 著者所属（和/英）	東京大学大学院情報理工学系研究科 Graduate School of Information Science and Technology, The University of Tokyo
第 5 著者氏名（和/英）	牛久祥孝 / Yoshitaka USHIKU
第 5 著者所属（和/英）	東京大学大学院情報理工学系研究科 Graduate School of Information Science and Technology, The University of Tokyo
第 6 著者氏名（和/英）	原田達也 / Tatsuya HARADA
第 6 著者所属（和/英）	東京大学大学院情報理工学系研究科:JSTさきがけ Graduate School of Information Science and Technology:JST PRESTO, The University of Tokyo
第 7 著者氏名（和/英）	國吉康夫 / Yasuo KUNIYOSHI
第 7 著者所属（和/英）	東京大学大学院情報理工学系研究科 Graduate School of Information Science and Technology, The University of Tokyo
発表年月日	2013-03-14
資料番号	PRMU2012-184
巻番号（vol）	vol.112
号番号（no）	495
ページ範囲	pp.-
ページ数	6
発行日