講演名 2000/5/18
他エージェントの内部モデル推定を利用したマルチエージェント強化学習法
長行 康男, 石井 信,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) マルチエージェント強化学習の研究が近年注目を集めている.マルチエージェント環境において, 個々のエージェントの実行した行動の良し悪しは他エージェントに依存する.我々は以前, 他エージェントの内部モデル推定を利用したマルチエージェント強化学習法を提案した.そこでは, 他エージェントの内部モデル推定に他エージェントの行動観測を用いた.本研究では, 他エージェントの内部モデル推定法として自己参照推定法を提案する.そして, 追跡問題を課題として, この2つの内部モデル推定法を利用したマルチエージェント強化学習法を比較検討した.
抄録(英) The application of reinforcement learning to multi-agent systems has attracted recent attention. In a multi-agent environment, whether one agent's action is good or not depends on the other agents. We formerly proposed a multi-agent reinforcement learning method based on the estimation of the other agent's internal model. There, the internal model was estimated by the observation of past actions of the other agent. In this study, we consider a self-reference method for estimating the other agent's internal model. By using the pursuit problem as a testbed, we compare the two estimation methods.
キーワード(和) マルチエージェント強化学習 / Q学習 / 内部モデル / 追跡問題 / 自己参照
キーワード(英) multi-agent reinforcement learning / Q-learning / internal model / pursuit problem / self-reference
資料番号 AI2000-4
発行日

研究会情報
研究会 AI
開催期間 2000/5/18(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Artificial Intelligence and Knowledge-Based Processing (AI)
本文の言語 JPN
タイトル(和) 他エージェントの内部モデル推定を利用したマルチエージェント強化学習法
サブタイトル(和)
タイトル(英) Multi-agent reinforcement learning methods using the estimation of the other agent's internal model
サブタイトル(和)
キーワード(1)(和/英) マルチエージェント強化学習 / multi-agent reinforcement learning
キーワード(2)(和/英) Q学習 / Q-learning
キーワード(3)(和/英) 内部モデル / internal model
キーワード(4)(和/英) 追跡問題 / pursuit problem
キーワード(5)(和/英) 自己参照 / self-reference
第 1 著者 氏名(和/英) 長行 康男 / Nagayasu Yasuo
第 1 著者 所属(和/英) 奈良先端科学技術大学院大学
Nara Institute of Science and Technology
第 2 著者 氏名(和/英) 石井 信 / Ishii Shin
第 2 著者 所属(和/英) 奈良先端科学技術大学院大学
Nara Institute of Science and Technology
発表年月日 2000/5/18
資料番号 AI2000-4
巻番号(vol) vol.100
号番号(no) 88
ページ範囲 pp.-
ページ数 8
発行日