リカレントネットワークによる非線形システムの動的制御

早川 美徳

講演名	2001/5/15 リカレントネットワークによる非線形システムの動的制御早川美徳,
PDFダウンロードページ	PDFダウンロードページへ
抄録(和)	時系列的な環境からの入力と、環境への出力を持つリカレントニューラルネットワークの強化学習則を考察した。神経回路は確率的に動作するニューロンから成り、行動の結果がグローバルな二値情報としてのみフィードバックされる。このような系での回路網の動作を解析し、望ましい結果を生むようなシナプス荷重の強化則はHebb的な学習則であること、さらに,それはネットワークの構造や、ニューロンの特性の詳細には依らないことを示した。このモデルを倒立振り子の課題に適用し、学習ダイナミクスについてて解析を行った。
抄録(英)	We consider the reinforcement learning of a recurrent neural network interacting to nonstationary environment. The neural network consists of stochastic neurons which may utilize the scalar information about the action taken to the environment. We derive a Hebbian-like rule for synaptic strengthing so as to increase a likelihood function for desirable results, and also discuss robustness of the learning rule. Finally, we apply the neural network model to the control of inverted pendulum.
キーワード(和)	ニューラルネットワーク / 確率的ニューロン / 強化学習 / ヘップ則
キーワード(英)	neural network / stochastic neuron / reinforcement learning, / Hebbian learning
資料番号	NLP2001-6
発行日

研究会情報
研究会	NLP
開催期間	2001/5/15(から1日開催)
開催地（和）
開催地（英）
テーマ（和）
テーマ（英）
委員長氏名（和）
委員長氏名（英）
副委員長氏名（和）
副委員長氏名（英）
幹事氏名（和）
幹事氏名（英）
幹事補佐氏名（和）
幹事補佐氏名（英）

講演論文情報詳細
申込み研究会	Nonlinear Problems (NLP)
本文の言語	JPN
タイトル（和）	リカレントネットワークによる非線形システムの動的制御
サブタイトル（和）
タイトル（英）	Control of Nonlinear Dynamical Systems with A Recurrent Neural Network
サブタイトル（和）
キーワード(1)（和/英）	ニューラルネットワーク / neural network
キーワード(2)（和/英）	確率的ニューロン / stochastic neuron
キーワード(3)（和/英）	強化学習 / reinforcement learning,
キーワード(4)（和/英）	ヘップ則 / Hebbian learning
第 1 著者氏名（和/英）	早川美徳 / Yoshinori Hayakawa
第 1 著者所属（和/英）	東北大学大学院理学研究科 Graduate School of Science, Tohoku university
発表年月日	2001/5/15
資料番号	NLP2001-6
巻番号（vol）	vol.101
号番号（no）	68
ページ範囲	pp.-
ページ数	8
発行日