講演名 1999/1/12
多戦略学習手法MS-RL : 環境変動下におけるロバストな学習エージェントの実現
岡本 充義, 山口 智浩, 谷内田 正彦,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本研究の目的は、学習条件が変動する動的環境でロバストかつ柔軟な学習エージェントの実現である。未知環境においてエージェントがロバストに行動する為に要求されるのは、収束に多量の時間を要する最適性ではなく、エージェントにおいて実現可能な限られた時間においての学習効率や, 環境の変動に対する適応や再学習能力である。しかし、このような変化する環境において、単一で静的/不変な条件を仮定した, 従来の強化学習アルゴリズムを用いると、対応ができずに学習パフォーマンスが大幅に低下するという問題が発生する。そこで本研究では、複数の異なる強化学習アルゴリズムを並列に実行する, 多戦略並列強化学習手法を提案する。
抄録(英) The object of this research is to realize a robust and flexible learning agent under a variant environment with intermittent changes of the learning conditions. Reinforcement learning is one of the possible behavior learning methods for an agent that behaves robustly in an unknown environment. Most previous reinforcement learning researches assume the limited conditions such as MDP environment to guarantee a rationality for learning, and tend to seek the convergence of the optimal learning result in infinite learning time. This paper presents Multi-Strategy Parallel Reinforcement Learning method (MSP-RL, in short) that performs the several different reinforcement learning algorithms in parallel.
キーワード(和) 環境変動 / 強化学習 / 確率的傾斜法 / 学習度
キーワード(英) the intermittent change of the environment / Reinforcement Learning / a stochastic gradient method / learning parameter
資料番号 AI98-73
発行日

研究会情報
研究会 AI
開催期間 1999/1/12(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Artificial Intelligence and Knowledge-Based Processing (AI)
本文の言語 JPN
タイトル(和) 多戦略学習手法MS-RL : 環境変動下におけるロバストな学習エージェントの実現
サブタイトル(和)
タイトル(英) MS-RL : Multi-Strategy Reinforcement Learning method for a learning agent under a variant environment
サブタイトル(和)
キーワード(1)(和/英) 環境変動 / the intermittent change of the environment
キーワード(2)(和/英) 強化学習 / Reinforcement Learning
キーワード(3)(和/英) 確率的傾斜法 / a stochastic gradient method
キーワード(4)(和/英) 学習度 / learning parameter
第 1 著者 氏名(和/英) 岡本 充義 / Mitsuyoshi OKAMOTO
第 1 著者 所属(和/英) 大阪大学基礎工学研究科
Graduate School of Engineering Science, Osaka University
第 2 著者 氏名(和/英) 山口 智浩 / Tomohiro YAMAGUCHI
第 2 著者 所属(和/英) 大阪大学基礎工学研究科
Graduate School of Engineering Science, Osaka University
第 3 著者 氏名(和/英) 谷内田 正彦 / Masahiko YACHIDA
第 3 著者 所属(和/英) 大阪大学基礎工学研究科
Graduate School of Engineering Science, Osaka University
発表年月日 1999/1/12
資料番号 AI98-73
巻番号(vol) vol.98
号番号(no) 499
ページ範囲 pp.-
ページ数 8
発行日