講演名 | 2002/11/2 離散時間型マルコフ決定過程における最適性方程式と最適政策の特性 胡 奇英, 岳 五一, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 本論文は,モデルが良好な定義をもち,最適方程式が確実であるという弱条件のもとで,総期待割引コストを規準とした場合の離散時間型マルコフ決定プロセスにおける最適性方程式と最適政策の特性を明らかにし,最適値関数を最適性方程式の解として特徴づけ,最適政策の構造を与えるものである.本解析は,現在,最も重要な研究分野のインターネットやコンピュータネットワークのような情報通信ネットワークなどのフロー制御,システム保全,またマルコフ決定過程の最適化問題への応用が期待される. |
抄録(英) | This paper investigates the properties of the optimality equation and optimal policies in discrete time Markov decision processes with expected discounted total rewards under the weak conditions that the model is well defined and the optimality equation is true. The optimal value function is characterized as a solution of the optimality equation and the structure of optimal policies is also given. |
キーワード(和) | マルコフ決定過程 / 最適性方程式 / 最適政策 / 総期待割引コスト |
キーワード(英) | Discrete time / Markov decision processes / Optimality equation / Optimal policies / Expected discounted total rewards |
資料番号 | CAS2002-103 |
発行日 |
研究会情報 | |
研究会 | CAS |
---|---|
開催期間 | 2002/11/2(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Circuits and Systems (CAS) |
---|---|
本文の言語 | ENG |
タイトル(和) | 離散時間型マルコフ決定過程における最適性方程式と最適政策の特性 |
サブタイトル(和) | |
タイトル(英) | Properties of the Optimality Equation and Optimal Policies in Discrete Time Markov Decision Processes |
サブタイトル(和) | |
キーワード(1)(和/英) | マルコフ決定過程 / Discrete time |
キーワード(2)(和/英) | 最適性方程式 / Markov decision processes |
キーワード(3)(和/英) | 最適政策 / Optimality equation |
キーワード(4)(和/英) | 総期待割引コスト / Optimal policies |
第 1 著者 氏名(和/英) | 胡 奇英 / Qiying HU |
第 1 著者 所属(和/英) | 西安電子科技大学経済管理学院 School of Economics & Management, Xidian University |
第 2 著者 氏名(和/英) | 岳 五一 / Wuyi YUE |
第 2 著者 所属(和/英) | 甲南大学理工学部 Faculty of Science and Engineering, Konan University |
発表年月日 | 2002/11/2 |
資料番号 | CAS2002-103 |
巻番号(vol) | vol.102 |
号番号(no) | 427 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |