講演名 2003/12/1
強化学習による強化信号の出現確率を考慮した接近と回避の葛藤状態のラットの行動再現(一般)(ニューロインフォーマティックスとは何か)
野口 拓也, 村越 一支,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) Brown et al.(1964)は接近と回避のコンフリクト状態におけるラットの反応を調べた.動物実験の特徴として,(1)報酬と罰が同時に与えられる点,(2)環境が変化し,再学習をさせる点(3)確率的に報酬と罰が与えられる点が挙げられる.実験の結果,報酬獲得の過程において,報酬の与えられないことを経験していると,その後の無報酬による影響を減らすとし,罰を受けた場合,その後の罰による影響を減らすとしている.本稿では,既存の強化学習の手法を用いて,報酬及び罰の強化信号の獲得確率が異なる前学習の後に報酬を与えない,もしくは報酬と罰を同時に与える再学習を行ない,動物実験の結果の再現を試みた.しかし,従来の手法では,動物実験における特徴(3)による行動を再現できなかった.これに対応するアルゴリズムが必要だと考え,強化信号の獲得確率を考慮した学習パラメータ制御を導入したところ,Brown et al.(1964)の動物実験の結果を定性的に再現することができた.
抄録(英) Brown et al. (1964) investigated rat's behavior with the following features: (1) reward and punishment are provided at the same time, (2) rats relearn after environment changes, and (3) reward and punishment are provided with probabilities. The results are that exposure to nonreinforcement produces resistance to the decrernental effects of behavior after stochastic reward schedule and that exposure to both punishment and reinforcement produces resistance to the decremental effects of behavior after stochastic punishment schedule. This paper aims to simulate the rat's behabior in conflict of approach and avoidance by reinforcement learning in consideration of appearance probabilities of reinforcement signals. The former algorithms of reinforcement learning could not simulate the behavior of the feature (3). We improve the former reinforcement learning algorithms by controlling learning parameters in consideration of the acquisition probabilities of reinforcement signals. Our algorithm qualitatively simulates the result of the animal experiment of Brown et al. (1964).
キーワード(和) 強化学習 / 強化信号の出現確率 / ラットの行動 / 学習パラメータ制御
キーワード(英) Reinforcement learning / Rat's behavior / Learning parameter control / Appearance probability of reinforcement signal
資料番号 NC2003-98
発行日

研究会情報
研究会 NC
開催期間 2003/12/1(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Neurocomputing (NC)
本文の言語 JPN
タイトル(和) 強化学習による強化信号の出現確率を考慮した接近と回避の葛藤状態のラットの行動再現(一般)(ニューロインフォーマティックスとは何か)
サブタイトル(和)
タイトル(英) Simulation of Rat's behavior in conflict of approach and avoidance by reinforcement learning in cosideration of appearance probabilities of reinforcement signals
サブタイトル(和)
キーワード(1)(和/英) 強化学習 / Reinforcement learning
キーワード(2)(和/英) 強化信号の出現確率 / Rat's behavior
キーワード(3)(和/英) ラットの行動 / Learning parameter control
キーワード(4)(和/英) 学習パラメータ制御 / Appearance probability of reinforcement signal
第 1 著者 氏名(和/英) 野口 拓也 / Takuya NOGUCHI
第 1 著者 所属(和/英) 豊橋技術科学大学知識情報工学系
Department of Knowledge-based Information Engineering, Toyohashi University of Technology
第 2 著者 氏名(和/英) 村越 一支 / Kazushi MURAKOSHI
第 2 著者 所属(和/英) 豊橋技術科学大学知識情報工学系
Department of Knowledge-based Information Engineering, Toyohashi University of Technology
発表年月日 2003/12/1
資料番号 NC2003-98
巻番号(vol) vol.103
号番号(no) 490
ページ範囲 pp.-
ページ数 6
発行日