講演名 | 2013-03-14 複数の画像特徴とPassive-Aggressiveを用いたfine-grained classification(一般セッション,文字・文書の認識と理解及びアルゴリズム・システム評価) 郡司 直之, 樋口 貴之, 安本 晃基, 村岡 宏是, 牛久 祥孝, 原田 達也, 國吉 康夫, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 近年,fine-grained classificationに関する研究が盛んに行われているが,一般物体認識のために開発された様々な局所記述子や,最新のコーディング手法の性能評価はほとんど行われていない.そこで本研究では,ImageNet Large Scale Visual Recognition Challenge 2012 (ILSVRC2012)fine-grained classification taskで使用されたデータセットを用いて,複数の局所記述子とFisher Vectorの評価実験を行う. dense-samplingされたSIFT記述子とFisher Vectorを用いた時のAccuracyは20.5%であったが,複数の局所記述子を組み合わせ,画像に付与されたバウンディングボックスを利用することにより最終的にAccuracyが40.6%まで上昇し,ILSVRC2012 fine-grained classification taskにおいて1位となった.また,同様のデータセットを用いて提案手法と先行研究において提案された手法の性能を比較したところ,Accuracyにおいてstate-of-the-artを超える結果が得られた. |
抄録(英) | Recent years, fine-grained classification has been studied intensively. But, various local descriptors and encodings proposed for general object classification have not been applied to fine-grained classification many times. In this work, we evaluate such methods with a dataset, which was used in ImageNet Large Scale Visual Recognition Challenge (ILSVRC)2012 fine-grained classification task. When we use densely sampled SIFT descriptors and Fisher Vector, we achieve 20.5%accuracy. But, when we combine many kinds of local descriptors and utilize bounding boxes, our system yields 40.6%accuracy finally and ranks top in ILSVRC2012 fine-grained classification task. Furthermore, when we compare our system to a state-of-the-art method on a similar dataset, our system outperforms the state-of-the-art method in accuracy. |
キーワード(和) | 大規模画像認識 / 局所記述子 / fine-grained classification / Fisher Vector |
キーワード(英) | Large-scale image classification / local descriptor / fine-grained classification / Fisher Vector |
資料番号 | PRMU2012-184 |
発行日 |
研究会情報 | |
研究会 | PRMU |
---|---|
開催期間 | 2013/3/7(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Pattern Recognition and Media Understanding (PRMU) |
---|---|
本文の言語 | JPN |
タイトル(和) | 複数の画像特徴とPassive-Aggressiveを用いたfine-grained classification(一般セッション,文字・文書の認識と理解及びアルゴリズム・システム評価) |
サブタイトル(和) | |
タイトル(英) | Fine-grained classification with various local descriptors and Passive-Aggressive |
サブタイトル(和) | |
キーワード(1)(和/英) | 大規模画像認識 / Large-scale image classification |
キーワード(2)(和/英) | 局所記述子 / local descriptor |
キーワード(3)(和/英) | fine-grained classification / fine-grained classification |
キーワード(4)(和/英) | Fisher Vector / Fisher Vector |
第 1 著者 氏名(和/英) | 郡司 直之 / Naoyuki GUNJI |
第 1 著者 所属(和/英) | 東京大学大学院情報理工学系研究科 Graduate School of Information Science and Technology, The University of Tokyo |
第 2 著者 氏名(和/英) | 樋口 貴之 / Takayuki HIGUCHI |
第 2 著者 所属(和/英) | 東京大学大学院情報理工学系研究科 Graduate School of Information Science and Technology, The University of Tokyo |
第 3 著者 氏名(和/英) | 安本 晃基 / Koki YASUMOTO |
第 3 著者 所属(和/英) | 東京大学大学院情報理工学系研究科 Graduate School of Information Science and Technology, The University of Tokyo |
第 4 著者 氏名(和/英) | 村岡 宏是 / Hiroshi MURAOKA |
第 4 著者 所属(和/英) | 東京大学大学院情報理工学系研究科 Graduate School of Information Science and Technology, The University of Tokyo |
第 5 著者 氏名(和/英) | 牛久 祥孝 / Yoshitaka USHIKU |
第 5 著者 所属(和/英) | 東京大学大学院情報理工学系研究科 Graduate School of Information Science and Technology, The University of Tokyo |
第 6 著者 氏名(和/英) | 原田 達也 / Tatsuya HARADA |
第 6 著者 所属(和/英) | 東京大学大学院情報理工学系研究科:JSTさきがけ Graduate School of Information Science and Technology:JST PRESTO, The University of Tokyo |
第 7 著者 氏名(和/英) | 國吉 康夫 / Yasuo KUNIYOSHI |
第 7 著者 所属(和/英) | 東京大学大学院情報理工学系研究科 Graduate School of Information Science and Technology, The University of Tokyo |
発表年月日 | 2013-03-14 |
資料番号 | PRMU2012-184 |
巻番号(vol) | vol.112 |
号番号(no) | 495 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |