講演名 | 2006-03-21 リカレンスプロットを用いた強化学習における学習進度の評価 高橋 哲也, 安達 雅春, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 強化学習は,エージェントが環境に対して試行錯誤することにより学習を進めることから,環境が動的な場合に対しても適用できることが知られている.動的な環境を扱う場合,強化学習に内在する固有のパラメータを調整するメタ学習が有効であることが既に報告されている.本研究では,強化学習において,リカレンスプロットを適用した環境変化の検出法を提案した後,さらにリカレンスプロットにより獲得した指標を用いたメタ学習を提案する.結果として,提案したメタ学習を導入することにより,学習パフォーマンスが改善される例を示す. |
抄録(英) | Reinforcement learning is a kind of learning systems which can deal with an unknown environment. In the reinforcement learning, an agent learns the optimal actions by applying a trial-and-error to an environment. Therefore, it is known that it can apply also to a dynamic environment. It is already reported that the method of adjusting specific parameters in the reinforcement learning is effective, when an agent learns a dynamic environment. The method for adjusting the parameters is known as meta-learning in the reinforcement learning. In this article, we propose a novel method for detecting environmental changes using recurrence plots in the reinforcement learning, and present a meta-learning by using a feature of environmental changes obtained from recurrence plots. It is shown that the proposed meta-learning improves the learning performance. |
キーワード(和) | 強化学習 / 環境変化 / リカレンスプロット / メタ学習 |
キーワード(英) | reinforcement learning / environmental changes / recurrence plots / meta-learning |
資料番号 | NLP2005-155 |
発行日 |
研究会情報 | |
研究会 | NLP |
---|---|
開催期間 | 2006/3/14(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Nonlinear Problems (NLP) |
---|---|
本文の言語 | JPN |
タイトル(和) | リカレンスプロットを用いた強化学習における学習進度の評価 |
サブタイトル(和) | |
タイトル(英) | Evaluating Progress of Reinforcement Learning Using Recurrence Plots |
サブタイトル(和) | |
キーワード(1)(和/英) | 強化学習 / reinforcement learning |
キーワード(2)(和/英) | 環境変化 / environmental changes |
キーワード(3)(和/英) | リカレンスプロット / recurrence plots |
キーワード(4)(和/英) | メタ学習 / meta-learning |
第 1 著者 氏名(和/英) | 高橋 哲也 / Tetsuya TAKAHASHI |
第 1 著者 所属(和/英) | 東京電機大学大学院工学研究科電子工学専攻 / Department of Electronic Engineering, Graduate School of Engineering, Tokyo Denki University / |
第 2 著者 氏名(和/英) | 安達 雅春 / Masaharu ADACHI |
第 2 著者 所属(和/英) | |
発表年月日 | 2006-03-21 |
資料番号 | NLP2005-155 |
巻番号(vol) | vol.105 |
号番号(no) | 676 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |