講演名 2001/3/16
強化学習と教師あり学習を組み合わせたプリズム適応のモデル
阪口 豊, 高野 光雄,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) プリズム適応時の被験者の振舞いを説明するため, 教師あり学習と強化学習を組み合わせた学習モデルを提案する. 本モデルは, 到達運動の正確さを報酬として強化学習を行なう運動計画モジュールが, 教師あり学習によって運動の順モデルを獲得する内部モデルモジュールを利用して適切な運動指令を選択する. また, 運動結果と内部モデルに基づく予測を比較することにより, 内部モデルの信頼度を推定するとともに文脈の切替えを行なう. これにより, ゆっくりとした環境の変化に追随するとともに, 複数の異なる環境における動作を切り替える性質を実現している. 数値実験により提案したモデルの振舞いを検証したほか, 他のモジュール型学習モデルとの違いについて考察した.
抄録(英) The authors propose a visuo-motor learning model based on reinforcement learning(RL)and supervised learning(SL), in order to explain the human behavior during prism adaptation. In the proposed model, the motor planning module, which works with RL, chooses appropriate motor commands based on the prediction by the internal model modules which work with SL.Moreover,an appropriate internal model is selected by the RL-based context switching module. Utilizing the"reliability of internal model, "the model realizes both parameter modification for a gradual environmental change and context-switch for a sudden environmental change. The behavior of the proposed model is illustrated through a computer simulation. Te relation between the proposed model and other modular learning algorithms is discussed.
キーワード(和) プリズム適応 / 教師あり学習 / 強化学習 / 文脈切替え / 到達運動
キーワード(英) prism adaptation / supervised learning / reinforcement learning / context switching / reaching movement
資料番号 NC2000-169
発行日

研究会情報
研究会 NC
開催期間 2001/3/16(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Neurocomputing (NC)
本文の言語 JPN
タイトル(和) 強化学習と教師あり学習を組み合わせたプリズム適応のモデル
サブタイトル(和)
タイトル(英) A Model of Prism Adaptation based on Reinforcement Learning and Supervised Learning
サブタイトル(和)
キーワード(1)(和/英) プリズム適応 / prism adaptation
キーワード(2)(和/英) 教師あり学習 / supervised learning
キーワード(3)(和/英) 強化学習 / reinforcement learning
キーワード(4)(和/英) 文脈切替え / context switching
キーワード(5)(和/英) 到達運動 / reaching movement
第 1 著者 氏名(和/英) 阪口 豊 / Yutaka Sakaguchi
第 1 著者 所属(和/英) 電気通信大学大学院 情報システム学研究科
Graduate School of Information Systems, University of Electro-Communications
第 2 著者 氏名(和/英) 高野 光雄 / Mitsuo Takano
第 2 著者 所属(和/英) 電気通信大学大学院 情報システム学研究科
Graduate School of Information Systems, University of Electro-Communications
発表年月日 2001/3/16
資料番号 NC2000-169
巻番号(vol) vol.100
号番号(no) 688
ページ範囲 pp.-
ページ数 8
発行日