講演名 2000/2/3
揺らぎ駆動学習ニューラルネットの強化学習効果
工藤 昇, 奥田 郡元, 大堀 隆文, 渡辺 一央,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) TD(λ)法は, "actor-critic"と呼ばれる一対のニュートラルネットワークが強化信号に基づいた動的環境の状態制御則を獲得可能にする有効な戦略である.本論文では, Cart-Pole系における振り子の振り上げ・倒立維持課題, 二重振り子倒立維持課題および二重振り子先端振り上げ課題のシミュレーションを通して, FDL法が多層ニューラルネットワークTD(λ)戦略を適用可能し得ることを検証する.また, FDL法がTD(λ)戦略を用いずに上記の課題を学習できることをを検証する.
抄録(英) The TD(λ) method is a powerful strategy which enables a pair of neural networks(NNs), "actor" and "critic", to acquire the state control rules of dynamical environments on the basis of reinforcement signals. Through simulations of three tasks for swing up pole of Cart-Pole system and for keeping the double pendulum straight and upright, for raising the tip of double pendulum, we verified that a fluctuation-driven learning (FDL) rule made the multi-layered neural networks (MLNNs) applicable to the TD(λ) strategy. Furthermore, we discovered that the FDL rule enabled only one MLNN for actor to learn above tasks without TD(λ) strategy.
キーワード(和) 揺らぎ駆動学習 / 強化学習 / actor-critic / TD(λ)戦略 / シミュレーション
キーワード(英) fluctuation-driven learning / reinforcement learning / actor-critic / TD(λ) strategy simulation
資料番号 NC99-83
発行日

研究会情報
研究会 NC
開催期間 2000/2/3(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Neurocomputing (NC)
本文の言語 JPN
タイトル(和) 揺らぎ駆動学習ニューラルネットの強化学習効果
サブタイトル(和)
タイトル(英) Reinforcement leaning capabilities of neural networks using the fluctuation-driven learning rule.
サブタイトル(和)
キーワード(1)(和/英) 揺らぎ駆動学習 / fluctuation-driven learning
キーワード(2)(和/英) 強化学習 / reinforcement learning
キーワード(3)(和/英) actor-critic / actor-critic
キーワード(4)(和/英) TD(λ)戦略 / TD(λ) strategy simulation
キーワード(5)(和/英) シミュレーション
第 1 著者 氏名(和/英) 工藤 昇 / Noboru KUDO
第 1 著者 所属(和/英) 北海道工業大学
Department of Electrical Engineering, Hokkaido Institute of Technology
第 2 著者 氏名(和/英) 奥田 郡元 / Kuniyuki OKUDA
第 2 著者 所属(和/英) 北海道工業大学
Department of Electrical Engineering, Hokkaido Institute of Technology
第 3 著者 氏名(和/英) 大堀 隆文 / Takahumi OOHORI
第 3 著者 所属(和/英) 北海道工業大学
Department of Electrical Engineering, Hokkaido Institute of Technology
第 4 著者 氏名(和/英) 渡辺 一央 / Kazuhisa WATANABE
第 4 著者 所属(和/英) 北海道工業大学
Department of Electrical Engineering, Hokkaido Institute of Technology
発表年月日 2000/2/3
資料番号 NC99-83
巻番号(vol) vol.99
号番号(no) 612
ページ範囲 pp.-
ページ数 8
発行日