講演名 2001/5/15
リカレントネットワークによる非線形システムの動的制御
早川 美徳,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 時系列的な環境からの入力と、環境への出力を持つリカレントニューラルネットワークの強化学習則を考察した。神経回路は確率的に動作するニューロンから成り、行動の結果がグローバルな二値情報としてのみフィードバックされる。このような系での回路網の動作を解析し、望ましい結果を生むようなシナプス荷重の強化則はHebb的な学習則であること、さらに,それはネットワークの構造や、ニューロンの特性の詳細には依らないことを示した。このモデルを倒立振り子の課題に適用し、学習ダイナミクスについてて解析を行った。
抄録(英) We consider the reinforcement learning of a recurrent neural network interacting to nonstationary environment. The neural network consists of stochastic neurons which may utilize the scalar information about the action taken to the environment. We derive a Hebbian-like rule for synaptic strengthing so as to increase a likelihood function for desirable results, and also discuss robustness of the learning rule. Finally, we apply the neural network model to the control of inverted pendulum.
キーワード(和) ニューラルネットワーク / 確率的ニューロン / 強化学習 / ヘップ則
キーワード(英) neural network / stochastic neuron / reinforcement learning, / Hebbian learning
資料番号 NLP2001-6
発行日

研究会情報
研究会 NLP
開催期間 2001/5/15(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Nonlinear Problems (NLP)
本文の言語 JPN
タイトル(和) リカレントネットワークによる非線形システムの動的制御
サブタイトル(和)
タイトル(英) Control of Nonlinear Dynamical Systems with A Recurrent Neural Network
サブタイトル(和)
キーワード(1)(和/英) ニューラルネットワーク / neural network
キーワード(2)(和/英) 確率的ニューロン / stochastic neuron
キーワード(3)(和/英) 強化学習 / reinforcement learning,
キーワード(4)(和/英) ヘップ則 / Hebbian learning
第 1 著者 氏名(和/英) 早川 美徳 / Yoshinori Hayakawa
第 1 著者 所属(和/英) 東北大学大学院理学研究科
Graduate School of Science, Tohoku university
発表年月日 2001/5/15
資料番号 NLP2001-6
巻番号(vol) vol.101
号番号(no) 68
ページ範囲 pp.-
ページ数 8
発行日