講演名 2004/10/12
知覚変化予測に基づいた状態分割法を併用した強化学習(一般)
半田 久志,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿では,強化学習エージェントにとって望ましい状態分割は,エージェントに立脚性を与えるものであると考え,エージェントの知覚-行為系列に依拠した状態分割法を提案する.提案手法では,入力空間を量子化し,量子化された領域のそれぞれについて次時刻の知覚変化を予測する.予測時の精度(累積誤差)に基づいて状態空間を構成する.
抄録(英) The situatedness is one of the most important notion for constructing state segmentation of the reinforcement learning agents. Hence, we propose a new state segmentation method referring to sensation-action series. The proposed method quantizes input space, and anticipates the next inputs as a consequence of actions of agents. Moreover, the proposed method constitutes the state segmentation of agents based on anticipation accuracy.
キーワード(和) 強化学習 / growing neural gas / 漸増的な状態分割法
キーワード(英) reinforcement learning / growing neural gas / incremental state segmentation method
資料番号 NC2004-81
発行日

研究会情報
研究会 NC
開催期間 2004/10/12(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Neurocomputing (NC)
本文の言語 JPN
タイトル(和) 知覚変化予測に基づいた状態分割法を併用した強化学習(一般)
サブタイトル(和)
タイトル(英) Reinforcement Learning with State Segmentation Method based on Sensory Change Anticipations
サブタイトル(和)
キーワード(1)(和/英) 強化学習 / reinforcement learning
キーワード(2)(和/英) growing neural gas / growing neural gas
キーワード(3)(和/英) 漸増的な状態分割法 / incremental state segmentation method
第 1 著者 氏名(和/英) 半田 久志 / Hisashi HANDA
第 1 著者 所属(和/英) 岡山大学工学部
Faculty of Engineering, Okayama University
発表年月日 2004/10/12
資料番号 NC2004-81
巻番号(vol) vol.104
号番号(no) 349
ページ範囲 pp.-
ページ数 5
発行日