講演名 | 1997/3/17 遅延強化信号による視点移動の学習 西野 哲生, 柴田 克成, 岡部 洋一, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 人間は何かを見るとき、視点をその対象に移動させる。この視点移動は、認識という目的を達成するための行動と考えることができる。従って、視点をどのように動かすべきかを直接教示せずとも、システムに適切な視点移動を獲得させることは可能であるはずである。そこで、本研究では、適切な視点移動を獲得するための、強化学習の基づいた学習法を提案する。この学習では、システムに対しては、それが最終的に下した結論に対する遅延強化信号のみを与える。しかし、本研究で提案する学習法によれば、適切な視点移動を直接教示するような情報が与えられなくても、システムに適切な視点移動を獲得させることが可能であることを、シミュレーションによって示す。 |
抄録(英) | When watching something, we move our veiwpoint to it. This veiwpoint movement can be thought as one of actions to achieve recognition. Then it is supposed that a system can learn to move its viewpoint appropriately without teaching how to move its veiwpoint. We propose a learning method using reinforcement learning for a neural network to learn to move its veiwpoint appropriately. The system can obtain the delayed reinforcement signal calculated from the recognition result it made finally. We conclude from simulations that the method enables the system to move its viewpoint appropriately though any information which directly tells how to move its viewpoint isn't given. |
キーワード(和) | 強化学習 / 能動認識 / 視点移動 / Q-Learning |
キーワード(英) | reinforcement learning / active perception / sensor movement / Q-Learning |
資料番号 | NC96-135 |
発行日 |
研究会情報 | |
研究会 | NC |
---|---|
開催期間 | 1997/3/17(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Neurocomputing (NC) |
---|---|
本文の言語 | JPN |
タイトル(和) | 遅延強化信号による視点移動の学習 |
サブタイトル(和) | |
タイトル(英) | Learning of Viewpoint Movement by Delayed Reinforcement Signal |
サブタイトル(和) | |
キーワード(1)(和/英) | 強化学習 / reinforcement learning |
キーワード(2)(和/英) | 能動認識 / active perception |
キーワード(3)(和/英) | 視点移動 / sensor movement |
キーワード(4)(和/英) | Q-Learning / Q-Learning |
第 1 著者 氏名(和/英) | 西野 哲生 / Tetsuo Nishino |
第 1 著者 所属(和/英) | 東京大学先端科学技術研究センター Research Center for Advanced Science and Technology,the Univ. of Tokyo |
第 2 著者 氏名(和/英) | 柴田 克成 / Katsunari Shibata |
第 2 著者 所属(和/英) | 東京大学先端科学技術研究センター Research Center for Advanced Science and Technology,the Univ. of Tokyo |
第 3 著者 氏名(和/英) | 岡部 洋一 / Yoichi Okabe |
第 3 著者 所属(和/英) | 東京大学先端科学技術研究センター Research Center for Advanced Science and Technology,the Univ. of Tokyo |
発表年月日 | 1997/3/17 |
資料番号 | NC96-135 |
巻番号(vol) | vol.96 |
号番号(no) | 583 |
ページ範囲 | pp.- |
ページ数 | 8 |
発行日 |