講演抄録/キーワード |
講演名 |
2012-01-27 13:30
報酬と行動決定を伴う時系列データの強化学習を用いたオフライン分析 ○麻生英樹・城 真範・神嶌敏弘・赤穂昭太郎(産総研)・興梠貴英(東大) NC2011-115 |
抄録 |
(和) |
強化学習は環境中で動作するエージェントのオンライン行動最適化学習のモデルとして用いられることが多いが,マルコフ決定過程や部分観測マルコフ決定過程の上の方策最適化アルゴリズムや強化学習アルゴリズムを用いて,あらかじめ収集された報酬つき時系列データをマイニングし,データ生成過程のモデル化,特定の行動の価値評価,将来予測などを行う研究も行われてきている.本稿では,これまでの研究を紹介するとともに,循環器内科における診療データへの適用可能性を検討した結果について述べる. |
(英) |
Although the main applications of reinforcement learning (RL) is online
learning of intelligent agents working in environments, there exists some researches to use RL for analyzing collected time series data with rewards and actions, such as, dialog data in order to evaluate value of states, value of actions, and to predict future observations. In this paper, we introduce existing researches and also report on the applicability of the methods to the data from heart desease treatments. |
キーワード |
(和) |
強化学習 / マルコフ決定過程 / 時系列解析 / データマイニング / / / / |
(英) |
reinforcement learning / Markov decision process / time series analysis / data mining / / / / |
文献情報 |
信学技報, vol. 111, no. 419, NC2011-115, pp. 107-112, 2012年1月. |
資料番号 |
NC2011-115 |
発行日 |
2012-01-19 (NC) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NC2011-115 |