行動分割型マルチエージェントによる強化学習の高速化

中村 崇仁; 佐野 雅己; 沢田 康次

講演名	1999/7/19 行動分割型マルチエージェントによる強化学習の高速化中村崇仁, 佐野雅己, 沢田康次,
PDFダウンロードページ	PDFダウンロードページへ
抄録(和)	強化学習において、Temporal Difference (TD)学習の発展形であるQ-Learningがよく用いられている。この方法は、状態と行動の対を評価する。そのため、高次元空間では多大な時間、計算資源が必要となる。そこで、本研究では、単一のエージェントを、積極的に複数のエージェントとしてとらえ、出力(行動)の決定を分割するアルゴリズムを提案する。このアルゴリズムにより、探索空間を縮小することになり、収束までのステップ数、計算時間、消費メモリ量の改善がみられた。その評価を行い、応用例を示す。
抄録(英)	This paper describes an algorithm to speed up Q-Learning which is often used in reinforcement learning. Usually this learning method needs much time and computational resources, because it evaluates state-action pairs in high dimensional space. We propose the algorithm that positively regard single agent as multi agents and divide decision for outputs (actions). It reduces the number of the iterations until converge, calculation time, and memory size since search space is reduced. Besides it, we evaluate this algorithm and show some applications.
キーワード(和)	強化学習 / 高速化 / マルチエージェント / 階層化
キーワード(英)	reinforcement learning / acceleration / multi agent / hierarchical
資料番号	NC99-34
発行日

研究会情報
研究会	NC
開催期間	1999/7/19(から1日開催)
開催地（和）
開催地（英）
テーマ（和）
テーマ（英）
委員長氏名（和）
委員長氏名（英）
副委員長氏名（和）
副委員長氏名（英）
幹事氏名（和）
幹事氏名（英）
幹事補佐氏名（和）
幹事補佐氏名（英）

講演論文情報詳細
申込み研究会	Neurocomputing (NC)
本文の言語	JPN
タイトル（和）	行動分割型マルチエージェントによる強化学習の高速化
サブタイトル（和）
タイトル（英）	Acceleration of Reinforcement Learning Process Based out Action Allocated Multi Agents
サブタイトル（和）
キーワード(1)（和/英）	強化学習 / reinforcement learning
キーワード(2)（和/英）	高速化 / acceleration
キーワード(3)（和/英）	マルチエージェント / multi agent
キーワード(4)（和/英）	階層化 / hierarchical
第 1 著者氏名（和/英）	中村崇仁 / Shuji Nakamura
第 1 著者所属（和/英）	東北大学大学院情報科学研究科 Graduate School of Information Science, Tohoku Univ.
第 2 著者氏名（和/英）	佐野雅己 / Masaki Sano
第 2 著者所属（和/英）	東北大学電気通信研究所 Research Institute of Electrical Communication, Tohoku Univ.
第 3 著者氏名（和/英）	沢田康次 / Yasiji Sawada
第 3 著者所属（和/英）	東北大学電気通信研究所 Research Institute of Electrical Communication, Tohoku Univ.
発表年月日	1999/7/19
資料番号	NC99-34
巻番号（vol）	vol.99
号番号（no）	193
ページ範囲	pp.-
ページ数	8
発行日