講演名 2000/7/12
OFS2000-29 / AI2000-31 強化信号のコミュニケーションに基づくマルチエージェント強化学習
山口 智浩,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 強化学習は, 様々な状況に柔軟に適応するエージェントの有力な学習メカニズムとして注目されている.しかしながら, エージェント間での相互依存性のあるマルチエージェント環境では, 各エージェントへの適切な目標設定を行うのが困難であるので, 他のエージェントらとの相互作用をどう調整するかを扱う, 能動的かつ相互作用的な学習機能が必要となる.そこで本論文では, まず, 強化学習エージェントの学習目標がコミュニケート可能な強化信号であるとみなし, エージェント間でそれらを相互作用的に生成, 調整するための新しいマルチエージェント強化学習の枠組みを提案する.そして, 学習の目標と評価基準の自律生成の課題について議論する.
抄録(英) Reinforcement learning is the major learning mechanism for an agent to adapt itself to various situations flexibly.However, in a multiagent system environment that has mutual dependency among agents, it is difficult for a human to setup suitable learning goals for each agent.Therefore, it requires the active and interactive learning function that treats how to coordinate the interaction among other learning agents.This paper presents a new framework of multiagent reinforcement learning to generate and coordinate each learning goal interactively among agents.To realize this, it presents to treat each learning goal as a reinforcement signal that can be communicated among agents.Then the issues of the self-generation of goals and evaluation criteria are discussed.
キーワード(和) 強化学習 / マルチエージェント / 自己反映 / 強化信号 / コミュニケーション / インタラクティブ
キーワード(英) reinforcement learning / multiagent / self-reflection / reinforcement signal / communication / interactive
資料番号 OFS2000-29,AI2000-31
発行日

研究会情報
研究会 AI
開催期間 2000/7/12(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Artificial Intelligence and Knowledge-Based Processing (AI)
本文の言語 JPN
タイトル(和) OFS2000-29 / AI2000-31 強化信号のコミュニケーションに基づくマルチエージェント強化学習
サブタイトル(和)
タイトル(英) Reinforcement Signal Communication based Multiagent Reinforcement Learning
サブタイトル(和)
キーワード(1)(和/英) 強化学習 / reinforcement learning
キーワード(2)(和/英) マルチエージェント / multiagent
キーワード(3)(和/英) 自己反映 / self-reflection
キーワード(4)(和/英) 強化信号 / reinforcement signal
キーワード(5)(和/英) コミュニケーション / communication
キーワード(6)(和/英) インタラクティブ / interactive
第 1 著者 氏名(和/英) 山口 智浩 / Tomohiro YAMAGUCHI
第 1 著者 所属(和/英) 奈良工業高等専門学校 情報工学科
Department of Information Engineering, Nara National College of Technology
発表年月日 2000/7/12
資料番号 OFS2000-29,AI2000-31
巻番号(vol) vol.100
号番号(no) 199
ページ範囲 pp.-
ページ数 8
発行日