講演名 1995/11/16
マルチエージェントによる群・分業・コミュニケーションの創発
小野 典彦,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 近年, 自律的に振る舞うロボットやソフトウェアエージェントの集団に, 強化学習を利用して適切な協調関係を組織化させることを目指した研究が展開されている. しかしマルチエージェント環境における学習問題には単一のエージェントによる学習問題にはみられない特異な状況における学習が要求され, 既存の強化学習アルゴリズムがマルチエージェント環境で示す学習性能については不透明な要素が少なくない. ここでは, 各々強化学習が組み込まれ, 環境からの感覚入力に対して即応的に振る舞うエージェント群に群行動・分業・コミュニケーションなどの協調行動を組織化させることを試みると共に, マルチエージェントによる協調行動の学習の可能性ならびに限界について述べる.
抄録(英) To investigate the learning capabilities of reinforcement-learning agents under multi-agent environments, we have attempted to let multiple reinforcement-learning agents synthesize coordinated decision policies needed to accomplish their common goals effectively. So long as a small number of agents are engaged in their joint tasks and accordingly the state space for each agent is relatively small, even monolithic reinforcement-learning agents have successfully organized some interesting coordinated behavior. Most of such straightforward reinforcement-learning approaches, however, scale poorly to more complex multi-agent learning problems, because the state space for each learning agent grows exponentially in the number of its partner agents engaged in the joint task. This paper presents a modular reinforcement-learning approach to this kind of multi-agent learning problems and demonstrates its effective learning capabilities.
キーワード(和) マルチエージェントシステム / 機械学習 / 強化学習
キーワード(英) multi-agent systems / machine learning / reinforcement-learning
資料番号 AI95-39,PRU95-154
発行日

研究会情報
研究会 AI
開催期間 1995/11/16(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Artificial Intelligence and Knowledge-Based Processing (AI)
本文の言語 JPN
タイトル(和) マルチエージェントによる群・分業・コミュニケーションの創発
サブタイトル(和)
タイトル(英) Emergent Organization of Communication, Specialization, and Herding-Behavior among Reinforcement-Learning Agents
サブタイトル(和)
キーワード(1)(和/英) マルチエージェントシステム / multi-agent systems
キーワード(2)(和/英) 機械学習 / machine learning
キーワード(3)(和/英) 強化学習 / reinforcement-learning
第 1 著者 氏名(和/英) 小野 典彦 / Norihiko Ono
第 1 著者 所属(和/英) 徳島大学工学部
Faculty of Engineering, University of Tokushima
発表年月日 1995/11/16
資料番号 AI95-39,PRU95-154
巻番号(vol) vol.95
号番号(no) 363
ページ範囲 pp.-
ページ数 8
発行日