講演名 | 2004/3/12 分節化された状態空間での報酬伝播によるゲーム学習の加速 長田 悠吾, 大東 優, 石川 悟, 大森 隆司, 森川 幸治, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | ヒトは外界の現象を連続的現象として認識・記述できるが,同時に特徴的な事象を認識して時空間的に分節化することにより,現象の離散的な記述を行うことが出来る.そして,この離散的な情報表現を利用することで効率的な問題解決を可能にしている.本研究では,分節化された状態空間において環境から得られた報酬をずはやく伝播させることにより,目標状態へ達する為の重要な経過点となる状態を発見できることを示す.また、この手法で得られた重要状態に副報酬を設定することにより,強化学習が加速することを,単純なTVゲームの学習で示す. |
抄録(英) | Human can describe the world in discrete representations by recognizing characteristic phenomena in addition to the continuous one. It is thought that the discrete representation enables efficient problem solving. In this paper, we propose a method for finding a passing point which is important for reaching the goal by propagating the obtained reward throuhg the segmented state space. Moreover, we demonstrate that Reinforcement Learning is accelerated by setting a sub-reward at the important states found by our method in a simple video game learning. |
キーワード(和) | 状態空間の分節化 / 強化学習 / ゲーム学習 / 副報酬 |
キーワード(英) | segmentation of state space / reinforcement learning / game learning / sub-reward |
資料番号 | NC2003-196 |
発行日 |
研究会情報 | |
研究会 | NC |
---|---|
開催期間 | 2004/3/12(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Neurocomputing (NC) |
---|---|
本文の言語 | JPN |
タイトル(和) | 分節化された状態空間での報酬伝播によるゲーム学習の加速 |
サブタイトル(和) | |
タイトル(英) | Acceleration of game learning with reward propagation in segmented state space |
サブタイトル(和) | |
キーワード(1)(和/英) | 状態空間の分節化 / segmentation of state space |
キーワード(2)(和/英) | 強化学習 / reinforcement learning |
キーワード(3)(和/英) | ゲーム学習 / game learning |
キーワード(4)(和/英) | 副報酬 / sub-reward |
第 1 著者 氏名(和/英) | 長田 悠吾 / Yugo NAGATA |
第 1 著者 所属(和/英) | 北海道大学工学部 Faculty of Engineering, Hokkaido University |
第 2 著者 氏名(和/英) | 大東 優 / Yu OHIGASHI |
第 2 著者 所属(和/英) | 北海道大学工学研究科 Graduate School of Engineering, Hokkaido University |
第 3 著者 氏名(和/英) | 石川 悟 / Satoru ISHIKAWA |
第 3 著者 所属(和/英) | 北海道大学工学研究科 Graduate School of Engineering, Hokkaido University |
第 4 著者 氏名(和/英) | 大森 隆司 / Takashi OMORI |
第 4 著者 所属(和/英) | 北海道大学工学研究科 Graduate School of Engineering, Hokkaido University |
第 5 著者 氏名(和/英) | 森川 幸治 / Koji MORIKAWA |
第 5 著者 所属(和/英) | 松下電器産業株式会社先端技術研究所知能情報技術研究所 Advanced Technology Research Laboratory, Matsushita Electric Industrial Co.,Ltd. |
発表年月日 | 2004/3/12 |
資料番号 | NC2003-196 |
巻番号(vol) | vol.103 |
号番号(no) | 734 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |