講演名 2001/1/4
強化学習における状態空間の自律的構成方法
柴 武将, 石川 孝,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 強化学習は、環境から与えられる報酬をたよりにエージェント自らが最適な行動ルールを学習する。学習する行動ルールはエージェントが認識できる状態に基づいて決まるため、最適な状態空間の構成ができていなければ最適な行動ルールを学習することはできない。この問題を解決する方法としてエージェント自身が自律的に状態空間を分割する手法がある。本論文では、エージェントが状態空間を自律的に構成する手法として、線形近似を使った状態変化の統計的予測モデルに基づく状態空間の分割を用いる。環境が変化する場合に、この手法で状態空間の構築を行うための改良について述べる。また、改良した手法をカートアンドポール問題で適用した結果について考察する。
抄録(英) Reinforcement learning acquires the optimum action rules with the agent himself for the remuneration given from the environment.Since it is decided from the state which an agent can recognize, if the action rules for which it is asked has not conformed the optimum state space, it cannot gain the optimum action rules.There is a technique into which the agent itself divides state space autonomously as the method of solving this problem.This paper, describes a method of dividing state space based on the forecasting model of the state change using statistical alignment approximation as the technique of constituting state space autonomously.When environment changes, the improvement for building state space is described.Moreover, the improved technique is applied to the cart and pole problem and the result is shown.
キーワード(和) 強化学習 / 状態空間の構築 / 分割 / 動的環境 / 統計的手法 / 重回帰分析 / クラスタリング
キーワード(英) reinforcement learning / state space construction / dynamic environment / multi regression / clustering
資料番号 AI2000-65
発行日

研究会情報
研究会 AI
開催期間 2001/1/4(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Artificial Intelligence and Knowledge-Based Processing (AI)
本文の言語 JPN
タイトル(和) 強化学習における状態空間の自律的構成方法
サブタイトル(和)
タイトル(英) Autonomous Composition of the State Space in Reinforcement Learning
サブタイトル(和)
キーワード(1)(和/英) 強化学習 / reinforcement learning
キーワード(2)(和/英) 状態空間の構築 / state space construction
キーワード(3)(和/英) 分割 / dynamic environment
キーワード(4)(和/英) 動的環境 / multi regression
キーワード(5)(和/英) 統計的手法 / clustering
キーワード(6)(和/英) 重回帰分析
キーワード(7)(和/英) クラスタリング
第 1 著者 氏名(和/英) 柴 武将 / Takemasa SHIBA
第 1 著者 所属(和/英) 日本工業大学
Nippon Institute of Technology
第 2 著者 氏名(和/英) 石川 孝 / Takashi ISHIKAWA
第 2 著者 所属(和/英) 日本工業大学
Nippon Institute of Technology
発表年月日 2001/1/4
資料番号 AI2000-65
巻番号(vol) vol.100
号番号(no) 530
ページ範囲 pp.-
ページ数 6
発行日