講演名 2009-07-13
Composition of Feature Space and State Space Dynamics Models for Model-based Reinforcement Learning
,
PDFダウンロードページ PDFダウンロードページへ
抄録(和)
抄録(英) Learning a dynamics model and a reward model during reinforcement learning is a useful way, since the agent can also update its value function by using the models. In this paper, we propose a general dynamics model that is a composition of the feature space dynamics model and the state space dynamics model. This way enables to obtain a good generalization from a small number of samples because of the linearity of the state space dynamics, while it does not lose the accuracy. We demonstrate the simulation comparison of some dynamics models used together with a Dyna algorithm.
キーワード(和)
キーワード(英) Model-based reinforcement learning / Dyna-style planning / prioritized sweeping / dynamics model
資料番号 NLP2009-15,NC2009-8
発行日

研究会情報
研究会 NC
開催期間 2009/7/6(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Neurocomputing (NC)
本文の言語 ENG
タイトル(和)
サブタイトル(和)
タイトル(英) Composition of Feature Space and State Space Dynamics Models for Model-based Reinforcement Learning
サブタイトル(和)
キーワード(1)(和/英) / Model-based reinforcement learning
第 1 著者 氏名(和/英) / Akihiko YAMAGUCHI
第 1 著者 所属(和/英)
Graduate School of Information Science, Nara Institute of Science and Technology
発表年月日 2009-07-13
資料番号 NLP2009-15,NC2009-8
巻番号(vol) vol.109
号番号(no) 125
ページ範囲 pp.-
ページ数 6
発行日