講演名 2002/12/6
神経修飾物質系に対応づけた強化学習パラメータの制御法
水野 純也, 村越 一支,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 自然界における生体の脳は,報酬を得て罰から逃れるような適切な行動を,試行錯誤によって獲得する.強化学習は,このシステムを工学的に模倣した学習システムの枠組といえる.強化学習内で用いられる制御パラメータは,脳内に広く投射して各脳部位の機能の調整にかかわる神経修飾物質系と対応づけることができる.本研究では,神経修飾物質系の分泌が行動にどのような影響を与えるかを考慮し,環境の急激な変化に追従できる強化学習アルゴリズムを提案する.これまで得られていた報酬が減少した場合に,強化学習内で用いられる制御パラメータをうまく制御することで行動を素早く改善していく方法である.提案するアルゴリズムを実際に学習問題に適用した結果,突然の環境変化に柔軟に対応させることができた.
抄録(英) The brain gains appropriate behaviors which gets rewards and escapes punishments by trial and error. Reinforcement learning models such a nature's system by an engineering approach. Neuromodulators, which projects widely in brain and adjusts functions in each brain part, are matched with internal parameters of reinforcement learning. We propose a reinforcement learning algorithm which can follow sudden changes in environment by considering how neuromodulators affect behaviors. This method improves actions by controlling the internal parameters of reinforcement learning after the obtained reward decreased as compared with the past. We actually applied this algorithm to learning problems, with the result that it followed sudden changes in environment.
キーワード(和) 強化学習 / 急激な環境変化 / ノルアドレナリン / アセチルコリン / セロトニン
キーワード(英) Reinforcement Learning / sudden changes in environment / noradrenaline / acetylcholine / serotonin
資料番号 NC2002-102
発行日

研究会情報
研究会 NC
開催期間 2002/12/6(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Neurocomputing (NC)
本文の言語 JPN
タイトル(和) 神経修飾物質系に対応づけた強化学習パラメータの制御法
サブタイトル(和)
タイトル(英) A Parameter Control Method Inspired from Neuromodulators in Reinforcement Learning
サブタイトル(和)
キーワード(1)(和/英) 強化学習 / Reinforcement Learning
キーワード(2)(和/英) 急激な環境変化 / sudden changes in environment
キーワード(3)(和/英) ノルアドレナリン / noradrenaline
キーワード(4)(和/英) アセチルコリン / acetylcholine
キーワード(5)(和/英) セロトニン / serotonin
第 1 著者 氏名(和/英) 水野 純也 / Junya MIZUNO
第 1 著者 所属(和/英) 豊橋技術科学大学 知識情報工学系
Department of Knowledge-based Information Engineering, Toyohashi University of Technology
第 2 著者 氏名(和/英) 村越 一支 / Kazushi MURAKOSHI
第 2 著者 所属(和/英) 豊橋技術科学大学 知識情報工学系
Department of Knowledge-based Information Engineering, Toyohashi University of Technology
発表年月日 2002/12/6
資料番号 NC2002-102
巻番号(vol) vol.102
号番号(no) 508
ページ範囲 pp.-
ページ数 6
発行日