講演名 1997/3/17
遅延強化信号による視点移動の学習
西野 哲生, 柴田 克成, 岡部 洋一,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 人間は何かを見るとき、視点をその対象に移動させる。この視点移動は、認識という目的を達成するための行動と考えることができる。従って、視点をどのように動かすべきかを直接教示せずとも、システムに適切な視点移動を獲得させることは可能であるはずである。そこで、本研究では、適切な視点移動を獲得するための、強化学習の基づいた学習法を提案する。この学習では、システムに対しては、それが最終的に下した結論に対する遅延強化信号のみを与える。しかし、本研究で提案する学習法によれば、適切な視点移動を直接教示するような情報が与えられなくても、システムに適切な視点移動を獲得させることが可能であることを、シミュレーションによって示す。
抄録(英) When watching something, we move our veiwpoint to it. This veiwpoint movement can be thought as one of actions to achieve recognition. Then it is supposed that a system can learn to move its viewpoint appropriately without teaching how to move its veiwpoint. We propose a learning method using reinforcement learning for a neural network to learn to move its veiwpoint appropriately. The system can obtain the delayed reinforcement signal calculated from the recognition result it made finally. We conclude from simulations that the method enables the system to move its viewpoint appropriately though any information which directly tells how to move its viewpoint isn't given.
キーワード(和) 強化学習 / 能動認識 / 視点移動 / Q-Learning
キーワード(英) reinforcement learning / active perception / sensor movement / Q-Learning
資料番号 NC96-135
発行日

研究会情報
研究会 NC
開催期間 1997/3/17(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Neurocomputing (NC)
本文の言語 JPN
タイトル(和) 遅延強化信号による視点移動の学習
サブタイトル(和)
タイトル(英) Learning of Viewpoint Movement by Delayed Reinforcement Signal
サブタイトル(和)
キーワード(1)(和/英) 強化学習 / reinforcement learning
キーワード(2)(和/英) 能動認識 / active perception
キーワード(3)(和/英) 視点移動 / sensor movement
キーワード(4)(和/英) Q-Learning / Q-Learning
第 1 著者 氏名(和/英) 西野 哲生 / Tetsuo Nishino
第 1 著者 所属(和/英) 東京大学先端科学技術研究センター
Research Center for Advanced Science and Technology,the Univ. of Tokyo
第 2 著者 氏名(和/英) 柴田 克成 / Katsunari Shibata
第 2 著者 所属(和/英) 東京大学先端科学技術研究センター
Research Center for Advanced Science and Technology,the Univ. of Tokyo
第 3 著者 氏名(和/英) 岡部 洋一 / Yoichi Okabe
第 3 著者 所属(和/英) 東京大学先端科学技術研究センター
Research Center for Advanced Science and Technology,the Univ. of Tokyo
発表年月日 1997/3/17
資料番号 NC96-135
巻番号(vol) vol.96
号番号(no) 583
ページ範囲 pp.-
ページ数 8
発行日