講演名 | 2004/3/12 ファジィARTニューラルネットワークによる強化学習のための状態空間の構成法 神尾 武司, 曽我 咲十美, 三堀 邦彦, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 強化学習のエージェントに対して連続的な知覚入力が与えられる場合、状態空間の分割を行う必要がある。状態空間の構成はエージェントのタスク達成に大きな影響を与えるため、非常に重要な課題である。最近、適応共鳴理論(ART)ニューラルネットワークを用いて、この命題に取り組む研究がなされている。ところが、これらの研究の多くはARTを知覚入力に対する分類器として単純に使用しているだけである。そこで本研究では、強化学習の学習状況として価値関数の変化に着目し、それをARTの合成に利用することで、ARTによる強化学習のための状態空間の構成を試みる。 |
抄録(英) | If the continuous perceptual inputs are given to the agent in the reinforcement learning, they have to be classified into appropriate states. The state-space construction is very important because it affects the achievement of the task. Recently, several researchers have reported that the adaptive resonance theory (ART) neural network can be used to construct the state-space adaptively. However, most of them have simply used the ART network as the classifier for the perceptual inputs. In this report, we propose a new state-space construction method by Fuzzy-ART network, which is synthesized according to the results of the reinforcement learning. |
キーワード(和) | 強化学習 / 状態空間 / 適応共鳴理論 / ファジィART |
キーワード(英) | Reinforcement Learning / State-Space / Adaptive Resonance Theory / Fuzzy-ART |
資料番号 | NC2003-201 |
発行日 |
研究会情報 | |
研究会 | NC |
---|---|
開催期間 | 2004/3/12(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Neurocomputing (NC) |
---|---|
本文の言語 | JPN |
タイトル(和) | ファジィARTニューラルネットワークによる強化学習のための状態空間の構成法 |
サブタイトル(和) | |
タイトル(英) | A State-Space Construction for Reinforcement Learning Using Fuzzy-ART Neural Network |
サブタイトル(和) | |
キーワード(1)(和/英) | 強化学習 / Reinforcement Learning |
キーワード(2)(和/英) | 状態空間 / State-Space |
キーワード(3)(和/英) | 適応共鳴理論 / Adaptive Resonance Theory |
キーワード(4)(和/英) | ファジィART / Fuzzy-ART |
第 1 著者 氏名(和/英) | 神尾 武司 / Takeshi KAMIO |
第 1 著者 所属(和/英) | 広島市立大学情報科学部情報機械システム工学科 Hiroshima City University |
第 2 著者 氏名(和/英) | 曽我 咲十美 / Satomi SOGA |
第 2 著者 所属(和/英) | 広島市立大学情報科学部情報機械システム工学科 Hiroshima City University |
第 3 著者 氏名(和/英) | 三堀 邦彦 / Kunihiko MITSUBORI |
第 3 著者 所属(和/英) | 海上保安大学校 通信基礎工学講座 Japan Coast Guard Academy |
発表年月日 | 2004/3/12 |
資料番号 | NC2003-201 |
巻番号(vol) | vol.103 |
号番号(no) | 734 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |