講演名 2010-09-05
ユーザーの領域分割結果に基づく一般物体認識(テーマセッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
安倍 満, 吉田 悠一,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本報告では,一般物体認識の問題を,人間と計算機の対話型操作という観点から再考する.多くの一般物体認識アルゴリズムは,対象領域分割,特徴抽出,識別の3段階の処理で構成されている.通常,これら3つの処理は計算機により自動で行われるが,実用の場面では,領域分割の問題は必ずしも解く必要は無いと考えられる.アプリケーションによっては,ユーザーに大まかな領域分割を要求してもよいことが多いからである.大まかな領域分割では識別性能の低下が懸念されるが,学習用画像に対しても異なる複数の人間による大まかな領域分割データを多数集めておき,これらを用いて学習を行えば,この問題を回避できると考えられる.そこでこの仮説を立証するために"20 wild bird datasets"を作成し,識別性能を評価した.その結果,異なる領域分割データに基づいて,1枚の学習画像から複数の学習サンプルを生成して学習することで,識別率が向上することがわかった.特に,特徴量に位置情報を含むPHOG特徴量およびPHOW特徴量において,顕著な改善が見られることがわかった.
抄録(英) In this paper, we revisit a generic object recognition problem from a point of view of human-computer interaction. Many of existing algorithms of the generic object recognition consist of following three tasks: target region segmentation, feature extraction and classification. While these three tasks are automatically processed on a computer in the previous approaches, solving the target region segmentation task by a computer is not always necessary in many practical situations in which a recognition system can request a user to input rough segmentation data of a target. Although rough segmentation may not give enough classification performance, the use of many rough segmentation datasets in learning process will avoid this problem. In order to validate this hypothesis, we created "20 wild bird datasets" and evaluated classification accuracy of the datasets. Our experiments revealed that generating multiple training samples from a single image by using multiple rough segmentation datasets brought positive effects on classification accuracies, especially when image features including spacial information such as PHOG and PHOW were used.
キーワード(和) 一般物体認識 / ユーザーインタフェース
キーワード(英) Generic Object Recognition / User Interface
資料番号 PRMU2010-59,IBISML2010-31
発行日

研究会情報
研究会 PRMU
開催期間 2010/8/29(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Pattern Recognition and Media Understanding (PRMU)
本文の言語 JPN
タイトル(和) ユーザーの領域分割結果に基づく一般物体認識(テーマセッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
サブタイトル(和)
タイトル(英) Generic Object Recognition Based on Rough Segmentation Data Given by a User
サブタイトル(和)
キーワード(1)(和/英) 一般物体認識 / Generic Object Recognition
キーワード(2)(和/英) ユーザーインタフェース / User Interface
第 1 著者 氏名(和/英) 安倍 満 / Mitsuru AMBAI
第 1 著者 所属(和/英) 株式会社デンソーアイティーラボラトリ
Denso IT Laboratory, Inc.
第 2 著者 氏名(和/英) 吉田 悠一 / Yuichi YOSHIDA
第 2 著者 所属(和/英) 株式会社デンソーアイティーラボラトリ
Denso IT Laboratory, Inc.
発表年月日 2010-09-05
資料番号 PRMU2010-59,IBISML2010-31
巻番号(vol) vol.110
号番号(no) 187
ページ範囲 pp.-
ページ数 8
発行日