講演名 2003/10/17
教示者の行動目標を推定する見まね学習(PRMU&NCテーマセッション(4) : 模倣学習)(認識と学習,模倣学習)
杉本 徳和, 銅谷 賢治, 川人 光男,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 見まね学習において,特に教示者と見まね学習者の物理パラメータが異なる場合,運動軌道や制御則だけではなくその背後にある行動目標を推定する事は重要なトピックである.本研究で提案する新しい見まね学習方式では,まず観測された教示者の軌道から行動目標を推定する.さらに見まね学習者は状態空間のどの領域でどの行動目標を用いれば教示者の行動を最も良く説明できるかを推定し,その推定に従って行動目標を選択する事で教示者と定性的に同じ行動を取る.教示者の行動を一旦行動の目標に置き換えるため,両者に物理パラメータの差異が有る場合であっても見まね者は自分の物理ダイナミクスに基づいた出力が行なえる.
抄録(英) In imitation learning, it is critical that the imitator estimate not only the trajectory of the demonstrator but also its itentions. This is particularly true when the physical parameters between them are different. In this paper we propose a new approach for imitation learning. The imitator first estimate the subgoal of the demonstrator from its trajectory, and choose it to become its own subgoal. This way, the imitator evaluates its own behaviour rather than simply copying the output of the demonstrator, and can account for differences in dynamics in a natural way.
キーワード(和) 連続系強化学習 / 階層型強化学習 / モジュール強化学習 / 非線形制御
キーワード(英) Continuous / Hierarchical / Module reinfocement learning / Non-linear control
資料番号 PRMU2003-138,NC2003-69
発行日

研究会情報
研究会 NC
開催期間 2003/10/17(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Neurocomputing (NC)
本文の言語 JPN
タイトル(和) 教示者の行動目標を推定する見まね学習(PRMU&NCテーマセッション(4) : 模倣学習)(認識と学習,模倣学習)
サブタイトル(和)
タイトル(英) Imitation Learning by Estimating Intention of Demonstrator
サブタイトル(和)
キーワード(1)(和/英) 連続系強化学習 / Continuous
キーワード(2)(和/英) 階層型強化学習 / Hierarchical
キーワード(3)(和/英) モジュール強化学習 / Module reinfocement learning
キーワード(4)(和/英) 非線形制御 / Non-linear control
第 1 著者 氏名(和/英) 杉本 徳和 / Norikazu SUGIMOTO
第 1 著者 所属(和/英) 奈良先端科学技術大学院大学:ATR脳情報研究所:科学技術振興事業団CREST
NAra Institute of Science and Technology:ATR, Computational Neuroscience Laboratories:Creating the Brain, CREST, Japan Science and Technology Corporation
第 2 著者 氏名(和/英) 銅谷 賢治 / Kenji DOYA
第 2 著者 所属(和/英) 奈良先端科学技術大学院大学:ATR脳情報研究所:科学技術振興事業団CREST
NAra Institute of Science and Technology:ATR, Computational Neuroscience Laboratories:Creating the Brain, CREST, Japan Science and Technology Corporation
第 3 著者 氏名(和/英) 川人 光男 / Mitsuo KAWATO
第 3 著者 所属(和/英) 奈良先端科学技術大学院大学:ATR脳情報研究所
NAra Institute of Science and Technology:ATR, Computational Neuroscience Laboratories
発表年月日 2003/10/17
資料番号 PRMU2003-138,NC2003-69
巻番号(vol) vol.103
号番号(no) 392
ページ範囲 pp.-
ページ数 6
発行日