講演名 2006-03-21
リカレンスプロットを用いた強化学習における学習進度の評価
高橋 哲也, 安達 雅春,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 強化学習は,エージェントが環境に対して試行錯誤することにより学習を進めることから,環境が動的な場合に対しても適用できることが知られている.動的な環境を扱う場合,強化学習に内在する固有のパラメータを調整するメタ学習が有効であることが既に報告されている.本研究では,強化学習において,リカレンスプロットを適用した環境変化の検出法を提案した後,さらにリカレンスプロットにより獲得した指標を用いたメタ学習を提案する.結果として,提案したメタ学習を導入することにより,学習パフォーマンスが改善される例を示す.
抄録(英) Reinforcement learning is a kind of learning systems which can deal with an unknown environment. In the reinforcement learning, an agent learns the optimal actions by applying a trial-and-error to an environment. Therefore, it is known that it can apply also to a dynamic environment. It is already reported that the method of adjusting specific parameters in the reinforcement learning is effective, when an agent learns a dynamic environment. The method for adjusting the parameters is known as meta-learning in the reinforcement learning. In this article, we propose a novel method for detecting environmental changes using recurrence plots in the reinforcement learning, and present a meta-learning by using a feature of environmental changes obtained from recurrence plots. It is shown that the proposed meta-learning improves the learning performance.
キーワード(和) 強化学習 / 環境変化 / リカレンスプロット / メタ学習
キーワード(英) reinforcement learning / environmental changes / recurrence plots / meta-learning
資料番号 NLP2005-155
発行日

研究会情報
研究会 NLP
開催期間 2006/3/14(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Nonlinear Problems (NLP)
本文の言語 JPN
タイトル(和) リカレンスプロットを用いた強化学習における学習進度の評価
サブタイトル(和)
タイトル(英) Evaluating Progress of Reinforcement Learning Using Recurrence Plots
サブタイトル(和)
キーワード(1)(和/英) 強化学習 / reinforcement learning
キーワード(2)(和/英) 環境変化 / environmental changes
キーワード(3)(和/英) リカレンスプロット / recurrence plots
キーワード(4)(和/英) メタ学習 / meta-learning
第 1 著者 氏名(和/英) 高橋 哲也 / Tetsuya TAKAHASHI
第 1 著者 所属(和/英) 東京電機大学大学院工学研究科電子工学専攻 /
Department of Electronic Engineering, Graduate School of Engineering, Tokyo Denki University /
第 2 著者 氏名(和/英) 安達 雅春 / Masaharu ADACHI
第 2 著者 所属(和/英)
発表年月日 2006-03-21
資料番号 NLP2005-155
巻番号(vol) vol.105
号番号(no) 676
ページ範囲 pp.-
ページ数 6
発行日