講演名 2012-11-17
3次元物体認識に関わる景観予測機能のモデル化(BCI/BMIとその周辺,一般)
植野 徹, 朝倉 暢彦, 笹岡 貴史, 乾 敏郎,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 3次元物体に対する視点に依存しない認知は,特定の視点から見た2次元画像の特徴を用いた景観(View)に基づく処理と,物体の部分間の関係照合を含む3次元の構造記述処理によって実現されていることが様々な研究から明らかになっている.景観に基づく処理においては,既知の景観情報から新規な景観情報を知ることが必要である.本研究では,この景観の汎化メカニズムを景観予測機能としてモデル化し,GRBF(generalized radial basis function)ネットワークを用いたシミュレーションを行った.鉛直軸周りに時計回りの回転で0°と-10°に対応するペーパークリップ状物体の2つの景観を入力とし,+10°回転した景観を出力するようネットワークを学習させた.学習によって,ネットワークは学習した物体についてだけでなく,未学習の物体に関しても回転後の景観を予測できることが分かった.さらに,ネットワークの景観予測機能がより大きな回転角度に対しても機能するかを調べるため,出力を入力に繰り返しフィードバックする方法でテストを行った.結果,回転角度の増加に伴って予測誤差が増加したが,分析によって求めた正答率は+50°の回転に対しても85%以上だった.加えて,景観予測の正確さと回転角度の関係と,先行研究におけるペーパークリップ状物体を用いたヒトの再認実験の成績が一致することを確認した.
抄録(英) Previous studies have identified two processes for view-invariant 3-D object recognition. One is a view-based process that uses the 2-D image features of an object from a particular viewpoint, and the other is a structural-description process that includes verification of the spatial relations between distinct parts of the object. The view-based process requires generalization from stored view information to novel views. In this study, we model the mechanism of view generalization as a form of view prediction, and propose a neural network based on the generalized radial basis function (GRBF) network. The input of the network is a pair of 2-D views of a paper-clip object. These views are separated by a 10 degree rotation along the vertical axis. We trained the network to output a view of the same object after a further 10 degree rotation. Following training, the network was capable of predicting rotated views not only for a set of training objects but also for untrained objects. We then introduced a feedback loop from the output to the input, in order to investigate whether the network could predict views with larger rotations. The prediction error increased with the amount of rotation, but a prediction accuracy of about 80% was still achieved with rotations of up to 30 degrees. We demonstrated that the accuracy as a function of rotations is consistent with the human performance in the recognition experiment using paper-clip objects reported in the previous study.
キーワード(和) 物体認識 / 心的回転 / GRBFネットワーク
キーワード(英) Object recognition / Mental rotation / GRBF neural network
資料番号 NC2012-70
発行日

研究会情報
研究会 NC
開催期間 2012/11/9(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Neurocomputing (NC)
本文の言語 JPN
タイトル(和) 3次元物体認識に関わる景観予測機能のモデル化(BCI/BMIとその周辺,一般)
サブタイトル(和)
タイトル(英) A model of view prediction in three dimensional object recognition
サブタイトル(和)
キーワード(1)(和/英) 物体認識 / Object recognition
キーワード(2)(和/英) 心的回転 / Mental rotation
キーワード(3)(和/英) GRBFネットワーク / GRBF neural network
第 1 著者 氏名(和/英) 植野 徹 / Toru UENO
第 1 著者 所属(和/英) 京都大学大学院情報学研究科
Graduate School of Informatics, Kyoto University
第 2 著者 氏名(和/英) 朝倉 暢彦 / Nobuhiko ASAKURA
第 2 著者 所属(和/英) 京都大学大学院情報学研究科
Graduate School of Informatics, Kyoto University
第 3 著者 氏名(和/英) 笹岡 貴史 / Takafumi SASAOKA
第 3 著者 所属(和/英) 京都大学大学院情報学研究科
Graduate School of Informatics, Kyoto University
第 4 著者 氏名(和/英) 乾 敏郎 / Toshio INUI
第 4 著者 所属(和/英) 京都大学大学院情報学研究科
Graduate School of Informatics, Kyoto University
発表年月日 2012-11-17
資料番号 NC2012-70
巻番号(vol) vol.112
号番号(no) 298
ページ範囲 pp.-
ページ数 6
発行日