講演名 | 2001/5/15 リカレントネットワークによる非線形システムの動的制御 早川 美徳, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 時系列的な環境からの入力と、環境への出力を持つリカレントニューラルネットワークの強化学習則を考察した。神経回路は確率的に動作するニューロンから成り、行動の結果がグローバルな二値情報としてのみフィードバックされる。このような系での回路網の動作を解析し、望ましい結果を生むようなシナプス荷重の強化則はHebb的な学習則であること、さらに,それはネットワークの構造や、ニューロンの特性の詳細には依らないことを示した。このモデルを倒立振り子の課題に適用し、学習ダイナミクスについてて解析を行った。 |
抄録(英) | We consider the reinforcement learning of a recurrent neural network interacting to nonstationary environment. The neural network consists of stochastic neurons which may utilize the scalar information about the action taken to the environment. We derive a Hebbian-like rule for synaptic strengthing so as to increase a likelihood function for desirable results, and also discuss robustness of the learning rule. Finally, we apply the neural network model to the control of inverted pendulum. |
キーワード(和) | ニューラルネットワーク / 確率的ニューロン / 強化学習 / ヘップ則 |
キーワード(英) | neural network / stochastic neuron / reinforcement learning, / Hebbian learning |
資料番号 | NLP2001-6 |
発行日 |
研究会情報 | |
研究会 | NLP |
---|---|
開催期間 | 2001/5/15(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Nonlinear Problems (NLP) |
---|---|
本文の言語 | JPN |
タイトル(和) | リカレントネットワークによる非線形システムの動的制御 |
サブタイトル(和) | |
タイトル(英) | Control of Nonlinear Dynamical Systems with A Recurrent Neural Network |
サブタイトル(和) | |
キーワード(1)(和/英) | ニューラルネットワーク / neural network |
キーワード(2)(和/英) | 確率的ニューロン / stochastic neuron |
キーワード(3)(和/英) | 強化学習 / reinforcement learning, |
キーワード(4)(和/英) | ヘップ則 / Hebbian learning |
第 1 著者 氏名(和/英) | 早川 美徳 / Yoshinori Hayakawa |
第 1 著者 所属(和/英) | 東北大学大学院理学研究科 Graduate School of Science, Tohoku university |
発表年月日 | 2001/5/15 |
資料番号 | NLP2001-6 |
巻番号(vol) | vol.101 |
号番号(no) | 68 |
ページ範囲 | pp.- |
ページ数 | 8 |
発行日 |