講演名 2001/7/16
マルコフゲームにおける環境モデルの推定を利用したマルチエージェント強化学習法
長行 康男, 伊藤 実,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿では, マルコフゲームにおける新たなマルチエージェント強化学習法を提案する.本稿で提案するマルチエージェント強化学習法では, エージェントが, 環境モデル(環境内に存在する他エージェントの政策と, 環境の状態遷移関数)を推定し, その推定した環境モデルを利用して, (エージェントが)どの行動を実行すればどの環境状態に遷移するかを予測する.そして, その予測した環境状態における価値関数(V関数)を基に, どの行動を実行すればよいかを決定し, 強化学習を進行する.提案したマルチエージェント強化学習法をマルコフゲームの枠組みでモデル化した追跡問題に適用し, 実験を行った結果, その有効性が示される.
抄録(英) In this article, we propose a multi-agent reinforcement learning method for Markov games. In our multi-agent reinforcement learning method, each agent infers the environmental model which consists of the other agents' policies and the state transition function, and estimates the future states by using the inferred environmental model. Each agent conducts its reinforcement learning based on the estimated future states. In order to evaluate our multi-agent reinforcement learning method, we employ the variant of the pursuit problem as a task. Through experiments, we demonstrate that our multi-agent reinforcement learning method is effective.
キーワード(和) マルチエージェント強化学習法 / TD学習 / 環境モデル / マルコフゲーム / 追跡問題
キーワード(英) multi-agent reinforcement learning / TD learning / environmental model / Markov game / pursuit problem
資料番号 OFS2001-10,AI2001-15
発行日

研究会情報
研究会 AI
開催期間 2001/7/16(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Artificial Intelligence and Knowledge-Based Processing (AI)
本文の言語 JPN
タイトル(和) マルコフゲームにおける環境モデルの推定を利用したマルチエージェント強化学習法
サブタイトル(和)
タイトル(英) Multi-agent reinforcement learning method for Markov games : An approach based on the estimation of the environmental model
サブタイトル(和)
キーワード(1)(和/英) マルチエージェント強化学習法 / multi-agent reinforcement learning
キーワード(2)(和/英) TD学習 / TD learning
キーワード(3)(和/英) 環境モデル / environmental model
キーワード(4)(和/英) マルコフゲーム / Markov game
キーワード(5)(和/英) 追跡問題 / pursuit problem
第 1 著者 氏名(和/英) 長行 康男 / Yasuo Nagayuki
第 1 著者 所属(和/英) 奈良先端科学技術大学院大学
Nara Institute of Science and Technology
第 2 著者 氏名(和/英) 伊藤 実 / Minoru Ito
第 2 著者 所属(和/英) 奈良先端科学技術大学院大学
Nara Institute of Science and Technology
発表年月日 2001/7/16
資料番号 OFS2001-10,AI2001-15
巻番号(vol) vol.101
号番号(no) 210
ページ範囲 pp.-
ページ数 8
発行日