講演名 1997/7/24
強化学習による起き上がり運動パターンの獲得
森本 淳, 銅谷 賢治,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 運動制御の分野において, 定速歩行や直立姿勢の制御といった定常的な問題については数学的解析と制御への応用が進んでいる. しかし, 動物が止まっているところから歩きだす, 倒れている状態から起き上がるというような, 過渡的な運動は数学的扱いが困難である. そこで本研究では, 強化学習を用いた過渡的な運動の獲得について検討を行う. 具体的には, 3リンク2関節のロボットをテーマとした. 連続時間, 連続状態のTemporal Difference学習則を, 効率の良い関数近似手法と組み合わせることにより, 高次元空間での起立運動系列の学習が可能なことをシミュレーションにより示す.
抄録(英) In this study we consideris the "stand-up" task for a two-joint, three-link robot. In contrast to the case of steady walking or standing, the optimal trajectory for such a transient behavior is very difficult to derive. The goal of the task is to find a path that links a lying state to an upright state. The geometry of the robot is such that there is no static solution; the robot has to stand up dynamically utilizing the momentum of its body. We use reinforcement learning, in particular, continuous time and state temporal difference (TD) learning method. Successful results were obtained by combining continuous TD with an efficient method of function approximation in high dimentional state space.
キーワード(和) 強化学習 / 運動制御 / ロポティクス / 起き上がり運動
キーワード(英) reinfocement learning / motor control / robotics / stand up
資料番号 NC97-28
発行日

研究会情報
研究会 NC
開催期間 1997/7/24(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Neurocomputing (NC)
本文の言語 JPN
タイトル(和) 強化学習による起き上がり運動パターンの獲得
サブタイトル(和)
タイトル(英) Learning "stand-up" trajectories using reinforcement learning
サブタイトル(和)
キーワード(1)(和/英) 強化学習 / reinfocement learning
キーワード(2)(和/英) 運動制御 / motor control
キーワード(3)(和/英) ロポティクス / robotics
キーワード(4)(和/英) 起き上がり運動 / stand up
第 1 著者 氏名(和/英) 森本 淳 / Jun Morimoto
第 1 著者 所属(和/英) 奈良先端科学技術大学院大学 情報科学研究科 : ATR人間情報通信研究所
Graduate School of Infomation Science, Nara Institute of Science and Technology : ATR Human Information Processing Res. Labs.
第 2 著者 氏名(和/英) 銅谷 賢治 / Kenji Doya
第 2 著者 所属(和/英) 科学技術振興事業団 川人学習動態脳プロジェクト : 奈良先端科学技術大学院大学 情報科学研究科
Kawato Dynamic Brain Project, JST : Graduate School of Infomation Science, Nara Institute of Science and Technology
発表年月日 1997/7/24
資料番号 NC97-28
巻番号(vol) vol.97
号番号(no) 201
ページ範囲 pp.-
ページ数 8
発行日