講演名 1998/9/24
時系列情報を扱うことのできる分類システムの研究
福寄 雅洋, 原 章, 長尾 智晴,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 強化学習では様々な問題をマルコフ決定過程にモデル化して解決されている.しかし, 現実世界では, 環境がマルコフ的であってもエージェントの観測能力の欠如から非マルコフ的とみなされる環境が多く存在する.そこで, 近年, そのような部分観測マルコフ決定過程における研究も注目を浴びている.本研究では, 時系列情報を扱うことによってエイリアスを区別する手法として, 時系列依存分類システム(TCS)を提案する.TCSではルールにタグを用いて可変長の時系列情報を扱うことができる.そして, 環境入力を固定長のメモリに保持し, 1時刻前の情報を取り出すという内部への出力を扱うことによって時系列情報を扱う.本研究では, そのための学習方法について検討すると共に, 数々の迷路走行タスクに適用することによって本手法の有効性を確認する.
抄録(英) In this paper, Time-dependent Classifier System ; TCS is proposed to solve the perceptual aliasing in reinforcement learning as learning proceeds. In TCS, it keeps the constant length of time sequential information, and uses them only when it is necessary to solve the perceptual aliasing. So, the changeable lengths of rules are proposed in TCS using the time tags. And the internal action to detect the information before 1 time-step is used to link the present information to the past information. And the learning method is considered because it is complicated and difficult to learn by TCS. And the several maze problems with partially observable Markov decision processes are experimented to verify TCS's effectiveness.
キーワード(和) 分類システム / 強化学習 / 自律エージェント
キーワード(英) Classifier System / Reinforcement Learning / Autonomous Agent
資料番号 AI98-38
発行日

研究会情報
研究会 AI
開催期間 1998/9/24(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Artificial Intelligence and Knowledge-Based Processing (AI)
本文の言語 JPN
タイトル(和) 時系列情報を扱うことのできる分類システムの研究
サブタイトル(和)
タイトル(英) Time Dependent Classifier System
サブタイトル(和)
キーワード(1)(和/英) 分類システム / Classifier System
キーワード(2)(和/英) 強化学習 / Reinforcement Learning
キーワード(3)(和/英) 自律エージェント / Autonomous Agent
第 1 著者 氏名(和/英) 福寄 雅洋 / Masahiro FUKUYORI
第 1 著者 所属(和/英) 東京工業大学工学部像情報工学研究施設
Imaging Science and Engineering Laboratory, Tokyo Institute of Technology
第 2 著者 氏名(和/英) 原 章 / Akira HARA
第 2 著者 所属(和/英) 東京工業大学工学部像情報工学研究施設
Imaging Science and Engineering Laboratory, Tokyo Institute of Technology
第 3 著者 氏名(和/英) 長尾 智晴 / Tomoharu NAGAO
第 3 著者 所属(和/英) 東京工業大学工学部像情報工学研究施設
Imaging Science and Engineering Laboratory, Tokyo Institute of Technology
発表年月日 1998/9/24
資料番号 AI98-38
巻番号(vol) vol.98
号番号(no) 296
ページ範囲 pp.-
ページ数 8
発行日