講演名 2008-03-28
MPIによる並列計算を用いたマルチエージェント強化学習のカオス制御への適用
佐藤 倫久, 安達 雅春,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 強化学習は試行錯誤的学習アルゴリズムであり,明示的な教師信号を与えずに学習者が行った行動の評価のみを用いる学習法である.そのため望ましい行動を行えるようようになるまでの学習時間が非常に多い。そこで複数のエージェントが同時に学習し,効率よく学習を行えるマルチエージェント強化学習が提案されている.本研究では,共通の記憶を持つマルチエージェント強化学習をMPIによって実現し,カオス制御に適用した.その結果,シングルエージェント強化学習より短時間で同等の性能を示すことがわかった.また,複数回学習を繰り返しても同一の行動を選ぶ量子化状態は,カオス制御において重要な位置に対応する量子化状態である可能性が高いことを示唆する結果を得た.
抄録(英) A reinforcement learning is a trial and error process, therefore it takes a huge computation time. It multiple agents can learn simultaneously the computational time can be reduced. In this paper we attempt to apply a multi-agent reinforcement learning to chaos control. We implement a multi-agent reinforcement learning using Message-Passing Interface. We compared the control performance of the multi-agent reinforcement learning and that of a single agent reinforcement learning. As a result, the multi-agent reinforcement learning show almost the same performance with the single-agent one. Even if learning iterate for a many times. Moreover, it is suggested that the quantized states whose action after learning by the multi-agent are the same, are important locations for the chaos control.
キーワード(和) カオスの制御 / 強化学習 / MPI
キーワード(英) control of chaos / reinforcement lerning / MPI (Message-Passing Interface)
資料番号 NLP2007-169
発行日

研究会情報
研究会 NLP
開催期間 2008/3/21(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Nonlinear Problems (NLP)
本文の言語 JPN
タイトル(和) MPIによる並列計算を用いたマルチエージェント強化学習のカオス制御への適用
サブタイトル(和)
タイトル(英) A Multi-agent Reinforcement Learning with Parallel Computation and its Application to Chaos Control
サブタイトル(和)
キーワード(1)(和/英) カオスの制御 / control of chaos
キーワード(2)(和/英) 強化学習 / reinforcement lerning
キーワード(3)(和/英) MPI / MPI (Message-Passing Interface)
第 1 著者 氏名(和/英) 佐藤 倫久 / Norihisa SATO
第 1 著者 所属(和/英) 東京電機大学工学部
School of Engineering, Tokyo Denki University
第 2 著者 氏名(和/英) 安達 雅春 / Masaharu ADACHI
第 2 著者 所属(和/英) 東京電機大学工学部
School of Engineering, Tokyo Denki University
発表年月日 2008-03-28
資料番号 NLP2007-169
巻番号(vol) vol.107
号番号(no) 561
ページ範囲 pp.-
ページ数 6
発行日