講演名 2003/10/16
強化学習とフィードバック誤差学習を用いた腕の姿勢制御(NC一般セッション(3))(認識と学習,模倣学習)
神原 裕行, 閔 庚甫, 金 載烋, 佐藤 誠, 小池 康晴,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本研究では,強化学習の枠組みの一つであるActor-Critic法と,フィードバック誤差学習とを組み合わせた運動学習モデルを提案する.フィードバック誤差学習におけるフィードバック制御器を,Actor-Critic法により獲得するとともに,Actorの制御出力を教師信号として制御対象の逆ダイナミクスモデルを獲得する.そして,この学習モデルを鉛直平面内における腕の姿勢制御タスクに適用し,報酬というスカラー量のみから,タスクを達成するためのフィードフォワード運動指令が獲得できることを示す.
抄録(英) In this paper, we propose a learning system with Actor-Critic method and feedback error learning. Actor-Critic method is one of the major framework in reinforcement learning. We use this method for obtaining the feedback controller in feedback error learning architecture, and Actor's output is used as an error signal of inverse dynamics model. By appling the proposed learning system to arm's posture control, we shows that a proper feedforward motor command could be acquired from all by a scalar value of reward.
キーワード(和) 教科学習 / Actor-Critic法 / フィードバック誤差学習 / 逆ダイナミクスモデル / 姿勢制御
キーワード(英) Reinforcement Learing / Actor-Critic / Feedback Error Learing / Inverse Dynamics Model / Posture Control
資料番号 PRMU2003-124,NC2003-55
発行日

研究会情報
研究会 NC
開催期間 2003/10/16(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Neurocomputing (NC)
本文の言語 JPN
タイトル(和) 強化学習とフィードバック誤差学習を用いた腕の姿勢制御(NC一般セッション(3))(認識と学習,模倣学習)
サブタイトル(和)
タイトル(英) Learning Arm's Posture Control using Reinforcement Learning and Feedback Error Learning
サブタイトル(和)
キーワード(1)(和/英) 教科学習 / Reinforcement Learing
キーワード(2)(和/英) Actor-Critic法 / Actor-Critic
キーワード(3)(和/英) フィードバック誤差学習 / Feedback Error Learing
キーワード(4)(和/英) 逆ダイナミクスモデル / Inverse Dynamics Model
キーワード(5)(和/英) 姿勢制御 / Posture Control
第 1 著者 氏名(和/英) 神原 裕行 / Hiroyuki KAMBARA
第 1 著者 所属(和/英) 東京工業大学大学院総合理工学研究科知能システム科学専攻
Department of Computational Intelligence and Systems Science, Interdisciplinary Graduate School of Science and Engineering, Tokyo Institute of Technology
第 2 著者 氏名(和/英) 閔 庚甫 / Kyuengbo MIN
第 2 著者 所属(和/英) 科学技術振興事業団さきがけ21,東京工業大学精密工学研究所
JST PRESTO, Precision and Intelligence Laboratory, Tokyo Institute of Technology
第 3 著者 氏名(和/英) 金 載烋 / Jaehyo KIM
第 3 著者 所属(和/英) 東京工業大学精密工学研究所
Precision and Intelligence Laboratory, Tokyo Institute of Technology
第 4 著者 氏名(和/英) 佐藤 誠 / Makoto SATO
第 4 著者 所属(和/英) 東京工業大学精密工学研究所
Precision and Intelligence Laboratory, Tokyo Institute of Technology
第 5 著者 氏名(和/英) 小池 康晴 / Yasuharu KOIKE
第 5 著者 所属(和/英) 科学技術振興事業団さきがけ21,東京工業大学精密工学研究所
JST PRESTO, Precision and Intelligence Laboratory, Tokyo Institute of Technology
発表年月日 2003/10/16
資料番号 PRMU2003-124,NC2003-55
巻番号(vol) vol.103
号番号(no) 391
ページ範囲 pp.-
ページ数 6
発行日