講演名 | 2003/6/20 ダイナミクスの線形性に基づいて状態空間を分割する階層型強化学習 杉本 徳和, 鮫島 和行, 銅谷 賢治, 川人 光男, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 本研究では上位・下位の2層からなる階層型の連続系強化学習法を提案する.下位レベルにおいて状態と行動を離散化し,上位レベルにて離散化された空間での強化学習を行なう事により,非線形系の制御が効率良く行なえる事を示す. |
抄録(英) | To apply reinforcement learning (RL) for task which have continuous state-space, for example robot control, we can use typical algorithm of reinforcement learning if continuous state-space have been decomposed into discrete state-space. But, critical issues are how to decompose a continuous state-space into discrete state-space. So, we propose a new hierarchical RL method consist of two layers. Bottom layer decompose a continuous state-space based on the linearity of dynamics. Top layer do RL in discrete state-space promoted by bottom layer. |
キーワード(和) | 連続系強化学習 / 階層型強化学習 / モジュール強化学習 / 非線形制御 |
キーワード(英) | Continuous-Hierarchical-Module reinfocement learning / Non-linear control |
資料番号 | NC2003-16 |
発行日 |
研究会情報 | |
研究会 | NC |
---|---|
開催期間 | 2003/6/20(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Neurocomputing (NC) |
---|---|
本文の言語 | JPN |
タイトル(和) | ダイナミクスの線形性に基づいて状態空間を分割する階層型強化学習 |
サブタイトル(和) | |
タイトル(英) | A Hierarchical Reinforcement Learning by Dividing State Space Based on the Linearity of Dynamics |
サブタイトル(和) | |
キーワード(1)(和/英) | 連続系強化学習 / Continuous-Hierarchical-Module reinfocement learning |
キーワード(2)(和/英) | 階層型強化学習 / Non-linear control |
キーワード(3)(和/英) | モジュール強化学習 |
キーワード(4)(和/英) | 非線形制御 |
第 1 著者 氏名(和/英) | 杉本 徳和 / Norikazu SUGIMOTO |
第 1 著者 所属(和/英) | 奈良先端科学技術大学院大学:ATR脳情報研究所:科学技術振興事業団CREST NAra Institute of Science and Technology:ATR, Computational Neuroscience Laboratories:Creating the Brain, CREST, Japan Science and Technology Corporation |
第 2 著者 氏名(和/英) | 鮫島 和行 / Kazuyuki SAMEJIMA |
第 2 著者 所属(和/英) | ATR脳情報研究所:科学技術振興事業団CREST ATR, Computational Neuroscience Laboratories:Creating the Brain, CREST, Japan Science and Technology Corporation |
第 3 著者 氏名(和/英) | 銅谷 賢治 / Kenji DOYA |
第 3 著者 所属(和/英) | 奈良先端科学技術大学院大学:ATR脳情報研究所:科学技術振興事業団CREST NAra Institute of Science and Technology:ATR, Computational Neuroscience Laboratories:Creating the Brain, CREST, Japan Science and Technology Corporation |
第 4 著者 氏名(和/英) | 川人 光男 / Mitsuo KAWATO |
第 4 著者 所属(和/英) | 奈良先端科学技術大学院大学:科学技術振興事業団CREST NAra Institute of Science and Technology:ATR, Computational Neuroscience Laboratories |
発表年月日 | 2003/6/20 |
資料番号 | NC2003-16 |
巻番号(vol) | vol.103 |
号番号(no) | 153 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |