講演名 | 2003/3/12 強化学習を用いた放射状迷路課題のモデル化 山崎 晋, 伊藤 真, 三宅 章吾, 佐藤 俊治, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | ラットが高度な記憶能力を必要とする放射状迷路課題のモデル化を行う.本研究では,放射状迷路課題を強化学習の問題として定式化する.本モデルでは,強化学習アルゴリズムの一つであるActor-Critic法にフィードバックを取り入れることにより,エージェントは過去の記憶を基に学習することができる.数値計算により,本モデルがラットの行動実験の結果を良く説明できるものとなることが示された. |
抄録(英) | We construct a model of a radial-arms maze task for rats in which a higher function of memory is required. We formulate a radial-arms maze task as a reinforcement learning problem. In this model, agent can successfully learn depnding on past memory by adding feedback to an Actor-Critic method that is one of reinforcement learning algorithms. Simulations show that the model explains a result of the behavioral experiment of a rat well. |
キーワード(和) | 放射状迷路課題 / 強化学習 / Actor-Critic法 / フィードバック |
キーワード(英) | radial-arms maze task / reinforcement learning / Actor-Critic method / feedback |
資料番号 | NC2002-224 |
発行日 |
研究会情報 | |
研究会 | NC |
---|---|
開催期間 | 2003/3/12(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Neurocomputing (NC) |
---|---|
本文の言語 | JPN |
タイトル(和) | 強化学習を用いた放射状迷路課題のモデル化 |
サブタイトル(和) | |
タイトル(英) | A Model for a Radial-Arms Maze Task using Reinforcement Learning |
サブタイトル(和) | |
キーワード(1)(和/英) | 放射状迷路課題 / radial-arms maze task |
キーワード(2)(和/英) | 強化学習 / reinforcement learning |
キーワード(3)(和/英) | Actor-Critic法 / Actor-Critic method |
キーワード(4)(和/英) | フィードバック / feedback |
第 1 著者 氏名(和/英) | 山崎 晋 / Susumu Yamazaki |
第 1 著者 所属(和/英) | 東北大学工学研究科応用物理学 Department of Applied Physics, Graduate School of Engineering, Tohoku University |
第 2 著者 氏名(和/英) | 伊藤 真 / Makoto Ito |
第 2 著者 所属(和/英) | 群馬大学医学部行動分析学教室CREST Department of Neurobiology and Behavior, School of Medicine, Gunma University |
第 3 著者 氏名(和/英) | 三宅 章吾 / Shogo Miyake |
第 3 著者 所属(和/英) | 東北大学工学研究科応用物理学 Department of Applied Physics, Graduate School of Engineering, Tohoku University |
第 4 著者 氏名(和/英) | 佐藤 俊治 / Shunji Satoh |
第 4 著者 所属(和/英) | 東北大学工学研究科応用物理学 Department of Applied Physics, Graduate School of Engineering, Tohoku University |
発表年月日 | 2003/3/12 |
資料番号 | NC2002-224 |
巻番号(vol) | vol.102 |
号番号(no) | 731 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |