講演名 2007-03-16
技能獲得過程の計算モデル
田口 林太郎, 石田 文彦, 阪口 豊,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 人間は学習によってさまざまな運動技能を獲得することができるが,複雑な技能を獲得しようとする際は,熟練経験者からの教示などが不可欠である.本研究では,こうした付加的な情報を与えることにより学習者のパフォーマンスがどのような影響を受けるかを強化学習に基づいたモデルを用いた数値実験により調査した.数値実験の結果,タスクの成否そのものを表す「直接報酬」に加えて,タスクに関連する仮想的な目標の達成度を表す「間接報酬」を適切に与えることで学習者の技能を向上させられることがわかった.
抄録(英) Although humans can acquire various motor skills by themselves, appropriate instructions by the expert instructors provides strong advantages for efficient learning, especially when we try to learn complex skills like skiing. In the present study, the authors built a reinforcement learning model which received "indirect reward", corresponding to such external instructions, in addition to the conventional reward telling the success/failure of the task, and examined how indirect reward affected the learning process through a computer-simulated experiment. The result shows that appropriate indirect reward assisted to build a superior internal model of the environment.
キーワード(和) 運動技能 / 報酬 / 強化学習 / 内部モデル
キーワード(英) Motor skill / Reward / Reinforcement learning / Internal model
資料番号 NC2006-190
発行日

研究会情報
研究会 NC
開催期間 2007/3/9(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Neurocomputing (NC)
本文の言語 JPN
タイトル(和) 技能獲得過程の計算モデル
サブタイトル(和)
タイトル(英) A computational study on motor skill aquisition
サブタイトル(和)
キーワード(1)(和/英) 運動技能 / Motor skill
キーワード(2)(和/英) 報酬 / Reward
キーワード(3)(和/英) 強化学習 / Reinforcement learning
キーワード(4)(和/英) 内部モデル / Internal model
第 1 著者 氏名(和/英) 田口 林太郎 / Rintaro TAGUCHI
第 1 著者 所属(和/英) 電気通信大学大学院情報システム学研究科
Graduate School of Information Systems, University of Electro-Communications
第 2 著者 氏名(和/英) 石田 文彦 / Fumihiko ISHIDA
第 2 著者 所属(和/英) 電気通信大学大学院情報システム学研究科
Graduate School of Information Systems, University of Electro-Communications
第 3 著者 氏名(和/英) 阪口 豊 / Yutaka SAKAGUCHI
第 3 著者 所属(和/英) 電気通信大学大学院情報システム学研究科
Graduate School of Information Systems, University of Electro-Communications
発表年月日 2007-03-16
資料番号 NC2006-190
巻番号(vol) vol.106
号番号(no) 590
ページ範囲 pp.-
ページ数 6
発行日