離散時間型マルコフ決定過程における最適性方程式と最適政策の特性

胡 奇英; 岳 五一

講演名	2002/11/2 離散時間型マルコフ決定過程における最適性方程式と最適政策の特性胡奇英, 岳五一,
PDFダウンロードページ	PDFダウンロードページへ
抄録(和)	本論文は,モデルが良好な定義をもち,最適方程式が確実であるという弱条件のもとで,総期待割引コストを規準とした場合の離散時間型マルコフ決定プロセスにおける最適性方程式と最適政策の特性を明らかにし,最適値関数を最適性方程式の解として特徴づけ,最適政策の構造を与えるものである.本解析は,現在,最も重要な研究分野のインターネットやコンピュータネットワークのような情報通信ネットワークなどのフロー制御,システム保全,またマルコフ決定過程の最適化問題への応用が期待される.
抄録(英)	This paper investigates the properties of the optimality equation and optimal policies in discrete time Markov decision processes with expected discounted total rewards under the weak conditions that the model is well defined and the optimality equation is true. The optimal value function is characterized as a solution of the optimality equation and the structure of optimal policies is also given.
キーワード(和)	マルコフ決定過程 / 最適性方程式 / 最適政策 / 総期待割引コスト
キーワード(英)	Discrete time / Markov decision processes / Optimality equation / Optimal policies / Expected discounted total rewards
資料番号	CAS2002-103
発行日

研究会情報
研究会	CAS
開催期間	2002/11/2(から1日開催)
開催地（和）
開催地（英）
テーマ（和）
テーマ（英）
委員長氏名（和）
委員長氏名（英）
副委員長氏名（和）
副委員長氏名（英）
幹事氏名（和）
幹事氏名（英）
幹事補佐氏名（和）
幹事補佐氏名（英）

講演論文情報詳細
申込み研究会	Circuits and Systems (CAS)
本文の言語	ENG
タイトル（和）	離散時間型マルコフ決定過程における最適性方程式と最適政策の特性
サブタイトル（和）
タイトル（英）	Properties of the Optimality Equation and Optimal Policies in Discrete Time Markov Decision Processes
サブタイトル（和）
キーワード(1)（和/英）	マルコフ決定過程 / Discrete time
キーワード(2)（和/英）	最適性方程式 / Markov decision processes
キーワード(3)（和/英）	最適政策 / Optimality equation
キーワード(4)（和/英）	総期待割引コスト / Optimal policies
第 1 著者氏名（和/英）	胡奇英 / Qiying HU
第 1 著者所属（和/英）	西安電子科技大学経済管理学院 School of Economics & Management, Xidian University
第 2 著者氏名（和/英）	岳五一 / Wuyi YUE
第 2 著者所属（和/英）	甲南大学理工学部 Faculty of Science and Engineering, Konan University
発表年月日	2002/11/2
資料番号	CAS2002-103
巻番号（vol）	vol.102
号番号（no）	427
ページ範囲	pp.-
ページ数	6
発行日