講演名 1998/3/19
モジュール型強化学習
山田 訓,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 複雑な制御を単純な制御の組み合わせで学習するモジュール型強化学習を提案する。モジュール型強化学習システムは制御モジュールと制御モジュールを選択する選択モジュールからなり、選択モジュールは制御対象の状態に応じて適切な制御モジュールを選択する。制御モジュール・選択モジュールはともにQ学習で制御を学習する。本報告ではモジュール型強化学習をKheperaロボットのゴールへの移動制御、対象物の収集制御に適用した結果を報告する。制御モジュールには制御対象の状態を表す入力の一部を入力し、選択モジュールには制御モジュールで計算されるQ値の最大値か最小値を入力した。モジュール化により入力空間を減少させることができるので、上記の制御を従来の強化学習より効率よく学習することができた。
抄録(英) We propose a modular reinforcement learning system which contains control modules and a selection module. The selection module selects an appropriate control module dependent on states. Both the control modules and the selection module are trained by Q-learning. The modular reinforcement learning was applied to the navigation and target-collection control of Khepera robot. Inputs of each control module are part of whole inputs, and inputs of the selection module are maximum or minimum of Q-values calculated in the control modules. The modular reinforcement learning system learned the navigation and target-collection control faster than reinforcement learning with a single network because it reduced the searching space for reinforcement learning.
キーワード(和) モジュール型強化学習 / ケペラロボット / 選択モジュール / 制御モジュール
キーワード(英) modular reinforcement learning / Khepera robot / selection module / control module
資料番号
発行日

研究会情報
研究会 NC
開催期間 1998/3/19(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Neurocomputing (NC)
本文の言語 JPN
タイトル(和) モジュール型強化学習
サブタイトル(和)
タイトル(英) Modular Reinforcement Learning
サブタイトル(和)
キーワード(1)(和/英) モジュール型強化学習 / modular reinforcement learning
キーワード(2)(和/英) ケペラロボット / Khepera robot
キーワード(3)(和/英) 選択モジュール / selection module
キーワード(4)(和/英) 制御モジュール / control module
第 1 著者 氏名(和/英) 山田 訓 / Satoshi Yamada
第 1 著者 所属(和/英) 三菱電機先端技術総合研究所
Advanced Technology R&D Center, Mitsubishi Electric Corporation
発表年月日 1998/3/19
資料番号
巻番号(vol) vol.97
号番号(no) 623
ページ範囲 pp.-
ページ数 8
発行日