講演名 1998/10/29
モジュール分割型強化学習エージェント群による協調行動の獲得 : 模擬ドッジボールゲームへの適用事例
吉田 伸一郎, 小野 典彦,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 筆者らは, マルチエージェント強化学習において顕著に生ずる問題点のひとつとして各エージェントの状態空間の爆発に焦点をあて, これを回避するための一方策としてモジュール分割型強化学習による接近法を提案し, 追跡問題の種々の変形版への適用を通して, その有効性を実験的に確認してきた.本研究では, 模擬ドッジボールゲームと称するマルチエージェント学習問題に対してモジュール分割型強化学習による接近を試み, エージェント群が創発的に獲得する協調行動を定性的かつ定量的に解析しながら, 本接近法の有効性を示す.
抄録(英) To investigate the potentials and limitations of multi-agent reinforcement learning(RL), many attempts have been reported to let multiple RL agents synthesize coordinated decision policies needed to accomplish their common goals effectively. In this paper, we consider the Simulated Dodgeball Game(SDG) as a multi-agent RL problem. In SDG, multiple attacker agents are required to learn to hit a single dodger agent by a ball. The dodger's behavior is manually-programmed in advance and it dose not change, but it is extremely difficult for the attackers to solely hit the dodger. We implement each attacker agent by modular RL architecture and show how successfully the modular RL attacker agents synthesize coordinated decision policies needed to achieve their common goal.
キーワード(和) マルチエージェントシステム / マルチエージェント強化学習 / 強化学習
キーワード(英) multi-agent systems / multi-agent reinforcement learning / reinforcement-learning
資料番号 CAS98-56,CST98-24
発行日

研究会情報
研究会 CAS
開催期間 1998/10/29(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Circuits and Systems (CAS)
本文の言語 ENG
タイトル(和) モジュール分割型強化学習エージェント群による協調行動の獲得 : 模擬ドッジボールゲームへの適用事例
サブタイトル(和)
タイトル(英) Synthesis of Coordinated Behavior by Modular Reinforcement Learning Agents in Simulated Dodgeball Games
サブタイトル(和)
キーワード(1)(和/英) マルチエージェントシステム / multi-agent systems
キーワード(2)(和/英) マルチエージェント強化学習 / multi-agent reinforcement learning
キーワード(3)(和/英) 強化学習 / reinforcement-learning
第 1 著者 氏名(和/英) 吉田 伸一郎 / Shin-ichiro Yoshida
第 1 著者 所属(和/英) 徳島大学工学部
Faculty of Engineering, University of Tokushima
第 2 著者 氏名(和/英) 小野 典彦 / Norihiko Ono
第 2 著者 所属(和/英) 徳島大学工学部
Faculty of Engineering, University of Tokushima
発表年月日 1998/10/29
資料番号 CAS98-56,CST98-24
巻番号(vol) vol.98
号番号(no) 370
ページ範囲 pp.-
ページ数 5
発行日