講演名 | 2000/7/12 OFS2000-29 / AI2000-31 強化信号のコミュニケーションに基づくマルチエージェント強化学習 山口 智浩, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 強化学習は, 様々な状況に柔軟に適応するエージェントの有力な学習メカニズムとして注目されている.しかしながら, エージェント間での相互依存性のあるマルチエージェント環境では, 各エージェントへの適切な目標設定を行うのが困難であるので, 他のエージェントらとの相互作用をどう調整するかを扱う, 能動的かつ相互作用的な学習機能が必要となる.そこで本論文では, まず, 強化学習エージェントの学習目標がコミュニケート可能な強化信号であるとみなし, エージェント間でそれらを相互作用的に生成, 調整するための新しいマルチエージェント強化学習の枠組みを提案する.そして, 学習の目標と評価基準の自律生成の課題について議論する. |
抄録(英) | Reinforcement learning is the major learning mechanism for an agent to adapt itself to various situations flexibly.However, in a multiagent system environment that has mutual dependency among agents, it is difficult for a human to setup suitable learning goals for each agent.Therefore, it requires the active and interactive learning function that treats how to coordinate the interaction among other learning agents.This paper presents a new framework of multiagent reinforcement learning to generate and coordinate each learning goal interactively among agents.To realize this, it presents to treat each learning goal as a reinforcement signal that can be communicated among agents.Then the issues of the self-generation of goals and evaluation criteria are discussed. |
キーワード(和) | 強化学習 / マルチエージェント / 自己反映 / 強化信号 / コミュニケーション / インタラクティブ |
キーワード(英) | reinforcement learning / multiagent / self-reflection / reinforcement signal / communication / interactive |
資料番号 | OFS2000-29,AI2000-31 |
発行日 |
研究会情報 | |
研究会 | AI |
---|---|
開催期間 | 2000/7/12(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Artificial Intelligence and Knowledge-Based Processing (AI) |
---|---|
本文の言語 | JPN |
タイトル(和) | OFS2000-29 / AI2000-31 強化信号のコミュニケーションに基づくマルチエージェント強化学習 |
サブタイトル(和) | |
タイトル(英) | Reinforcement Signal Communication based Multiagent Reinforcement Learning |
サブタイトル(和) | |
キーワード(1)(和/英) | 強化学習 / reinforcement learning |
キーワード(2)(和/英) | マルチエージェント / multiagent |
キーワード(3)(和/英) | 自己反映 / self-reflection |
キーワード(4)(和/英) | 強化信号 / reinforcement signal |
キーワード(5)(和/英) | コミュニケーション / communication |
キーワード(6)(和/英) | インタラクティブ / interactive |
第 1 著者 氏名(和/英) | 山口 智浩 / Tomohiro YAMAGUCHI |
第 1 著者 所属(和/英) | 奈良工業高等専門学校 情報工学科 Department of Information Engineering, Nara National College of Technology |
発表年月日 | 2000/7/12 |
資料番号 | OFS2000-29,AI2000-31 |
巻番号(vol) | vol.100 |
号番号(no) | 199 |
ページ範囲 | pp.- |
ページ数 | 8 |
発行日 |