講演名 | 1998/3/19 モジュール型強化学習 山田 訓, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 複雑な制御を単純な制御の組み合わせで学習するモジュール型強化学習を提案する。モジュール型強化学習システムは制御モジュールと制御モジュールを選択する選択モジュールからなり、選択モジュールは制御対象の状態に応じて適切な制御モジュールを選択する。制御モジュール・選択モジュールはともにQ学習で制御を学習する。本報告ではモジュール型強化学習をKheperaロボットのゴールへの移動制御、対象物の収集制御に適用した結果を報告する。制御モジュールには制御対象の状態を表す入力の一部を入力し、選択モジュールには制御モジュールで計算されるQ値の最大値か最小値を入力した。モジュール化により入力空間を減少させることができるので、上記の制御を従来の強化学習より効率よく学習することができた。 |
抄録(英) | We propose a modular reinforcement learning system which contains control modules and a selection module. The selection module selects an appropriate control module dependent on states. Both the control modules and the selection module are trained by Q-learning. The modular reinforcement learning was applied to the navigation and target-collection control of Khepera robot. Inputs of each control module are part of whole inputs, and inputs of the selection module are maximum or minimum of Q-values calculated in the control modules. The modular reinforcement learning system learned the navigation and target-collection control faster than reinforcement learning with a single network because it reduced the searching space for reinforcement learning. |
キーワード(和) | モジュール型強化学習 / ケペラロボット / 選択モジュール / 制御モジュール |
キーワード(英) | modular reinforcement learning / Khepera robot / selection module / control module |
資料番号 | |
発行日 |
研究会情報 | |
研究会 | NC |
---|---|
開催期間 | 1998/3/19(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Neurocomputing (NC) |
---|---|
本文の言語 | JPN |
タイトル(和) | モジュール型強化学習 |
サブタイトル(和) | |
タイトル(英) | Modular Reinforcement Learning |
サブタイトル(和) | |
キーワード(1)(和/英) | モジュール型強化学習 / modular reinforcement learning |
キーワード(2)(和/英) | ケペラロボット / Khepera robot |
キーワード(3)(和/英) | 選択モジュール / selection module |
キーワード(4)(和/英) | 制御モジュール / control module |
第 1 著者 氏名(和/英) | 山田 訓 / Satoshi Yamada |
第 1 著者 所属(和/英) | 三菱電機先端技術総合研究所 Advanced Technology R&D Center, Mitsubishi Electric Corporation |
発表年月日 | 1998/3/19 |
資料番号 | |
巻番号(vol) | vol.97 |
号番号(no) | 623 |
ページ範囲 | pp.- |
ページ数 | 8 |
発行日 |