講演名 2003/3/12
強化学習を用いた放射状迷路課題のモデル化
山崎 晋, 伊藤 真, 三宅 章吾, 佐藤 俊治,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) ラットが高度な記憶能力を必要とする放射状迷路課題のモデル化を行う.本研究では,放射状迷路課題を強化学習の問題として定式化する.本モデルでは,強化学習アルゴリズムの一つであるActor-Critic法にフィードバックを取り入れることにより,エージェントは過去の記憶を基に学習することができる.数値計算により,本モデルがラットの行動実験の結果を良く説明できるものとなることが示された.
抄録(英) We construct a model of a radial-arms maze task for rats in which a higher function of memory is required. We formulate a radial-arms maze task as a reinforcement learning problem. In this model, agent can successfully learn depnding on past memory by adding feedback to an Actor-Critic method that is one of reinforcement learning algorithms. Simulations show that the model explains a result of the behavioral experiment of a rat well.
キーワード(和) 放射状迷路課題 / 強化学習 / Actor-Critic法 / フィードバック
キーワード(英) radial-arms maze task / reinforcement learning / Actor-Critic method / feedback
資料番号 NC2002-224
発行日

研究会情報
研究会 NC
開催期間 2003/3/12(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Neurocomputing (NC)
本文の言語 JPN
タイトル(和) 強化学習を用いた放射状迷路課題のモデル化
サブタイトル(和)
タイトル(英) A Model for a Radial-Arms Maze Task using Reinforcement Learning
サブタイトル(和)
キーワード(1)(和/英) 放射状迷路課題 / radial-arms maze task
キーワード(2)(和/英) 強化学習 / reinforcement learning
キーワード(3)(和/英) Actor-Critic法 / Actor-Critic method
キーワード(4)(和/英) フィードバック / feedback
第 1 著者 氏名(和/英) 山崎 晋 / Susumu Yamazaki
第 1 著者 所属(和/英) 東北大学工学研究科応用物理学
Department of Applied Physics, Graduate School of Engineering, Tohoku University
第 2 著者 氏名(和/英) 伊藤 真 / Makoto Ito
第 2 著者 所属(和/英) 群馬大学医学部行動分析学教室CREST
Department of Neurobiology and Behavior, School of Medicine, Gunma University
第 3 著者 氏名(和/英) 三宅 章吾 / Shogo Miyake
第 3 著者 所属(和/英) 東北大学工学研究科応用物理学
Department of Applied Physics, Graduate School of Engineering, Tohoku University
第 4 著者 氏名(和/英) 佐藤 俊治 / Shunji Satoh
第 4 著者 所属(和/英) 東北大学工学研究科応用物理学
Department of Applied Physics, Graduate School of Engineering, Tohoku University
発表年月日 2003/3/12
資料番号 NC2002-224
巻番号(vol) vol.102
号番号(no) 731
ページ範囲 pp.-
ページ数 6
発行日