講演名 2012-01-27
報酬と行動決定を伴う時系列データの強化学習を用いたオフライン分析(一般,複雑系とニューロコンピューティング)
麻生 英樹, 城 真範, 神嶌 敏弘, 赤穂 昭太郎, 興梠 貴英,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 強化学習は環境中で動作するエージェントのオンライン行動最適化学習のモデルとして用いられることが多いが,マルコフ決定過程や部分観測マルコフ決定過程の上の状態・行動価値評価アルゴリズムや方策最適化アルゴリズムを用いて,あらかじめ収集された報酬つき時系列データをオフラインで分析し,行動や状態の価値評価,方策の改善,将来予測などを行う研究も行われてきている.本稿では,これまでの研究を紹介するとともに,循環器内科における診療記録データへの適用可能性を検討した結果について述べる.
抄録(英) Although the main applications of reinforcement learning (RL) is online learning of intelligent agents working in environments, there exist some researches to use RL for analyzing collected time series data with rewards and actions such as dialog data in order to evaluate value of states, value of actions, and to predict future observations. In this paper, we introduce existing researches and also report on the applicability of the methods to the data from heart desease treatments.
キーワード(和) 強化学習 / マルコフ決定過程 / 時系列分析 / データマイニング
キーワード(英) Reinforcement Learning / Markov Decision Process / Time-series Analysis / Data Mining
資料番号 NC2011-115
発行日

研究会情報
研究会 NC
開催期間 2012/1/19(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Neurocomputing (NC)
本文の言語 JPN
タイトル(和) 報酬と行動決定を伴う時系列データの強化学習を用いたオフライン分析(一般,複雑系とニューロコンピューティング)
サブタイトル(和)
タイトル(英) Analysis of Time Series Data Accompanied with Rewards and Actions using Reinforcement Learning
サブタイトル(和)
キーワード(1)(和/英) 強化学習 / Reinforcement Learning
キーワード(2)(和/英) マルコフ決定過程 / Markov Decision Process
キーワード(3)(和/英) 時系列分析 / Time-series Analysis
キーワード(4)(和/英) データマイニング / Data Mining
第 1 著者 氏名(和/英) 麻生 英樹 / Hideki ASOH
第 1 著者 所属(和/英) 独立行政法人産業技術総合研究所
National Institute of Advanced Industrial Science and Technology (AIST)
第 2 著者 氏名(和/英) 城 真範 / Masanori SHIRO
第 2 著者 所属(和/英) 独立行政法人産業技術総合研究所
National Institute of Advanced Industrial Science and Technology (AIST)
第 3 著者 氏名(和/英) 神嶌 敏弘 / Toshihiro KAMISHIMA
第 3 著者 所属(和/英) 独立行政法人産業技術総合研究所
National Institute of Advanced Industrial Science and Technology (AIST)
第 4 著者 氏名(和/英) 赤穂 昭太郎 / Shotaro AKAHO
第 4 著者 所属(和/英) 独立行政法人産業技術総合研究所
National Institute of Advanced Industrial Science and Technology (AIST)
第 5 著者 氏名(和/英) 興梠 貴英 / Takahide KOHRO
第 5 著者 所属(和/英) 東京大学医学部附属病院
The University of Tokyo Hospital
発表年月日 2012-01-27
資料番号 NC2011-115
巻番号(vol) vol.111
号番号(no) 419
ページ範囲 pp.-
ページ数 6
発行日