お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2010-11-05 15:30
[ポスター講演]動的計画法によるリターン分布推定
森村哲郎日本IBM)・杉山 将東工大)・鹿島久嗣東大)・八谷大岳東工大)・田中利幸京大IBISML2010-98
抄録 (和) (事前公開アブストラクト) リターン(累積報酬値)の分布推定により、分布から規定される任意の特徴量を指標とした意思決定策を考えることができる。そのため、リターン分布推定によって、期待値以外にバリュー・アット・リスク等のリスク指標も考慮した強化学習法の実現が期待できる。また、近年、リターン分布の推定法として、分布Bellman方程式を動的計画法に基づいて近似的に解く手法が提案された。しかしながら、その収束性に関する解析は十分でない。そこで本報告では、動的計画法により分布Bellman方程式を解いた場合の収束性を解析する。動的計画法により、リターンの初期推定分布に依存せず真のリターン分布に収束することや、真の分布のモーメントへの収束率を報告する。また、解析結果から、既存のリターン分布推定法の改善策についても議論する。 
(英) (Advance abstract in Japanese is available)
キーワード (和) / / / / / / /  
(英) / / / / / / /  
文献情報 信学技報, vol. 110, no. 265, IBISML2010-98, pp. 283-290, 2010年11月.
資料番号 IBISML2010-98 
発行日 2010-10-28 (IBISML) 
ISSN Print edition: ISSN 0913-5685    Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード IBISML2010-98

研究会情報
研究会 IBISML  
開催期間 2010-11-04 - 2010-11-06 
開催地(和) 東大生産研 
開催地(英) IIS, Univ. of Tokyo 
テーマ(和) IBIS 2010 (情報論的学習理論ワークショップ) 
テーマ(英) IBIS 2010 (Workshop on Information-based Induction Sciences) 
講演論文情報の詳細
申込み研究会 IBISML 
会議コード 2010-11-IBISML 
本文の言語 日本語 
タイトル(和) 動的計画法によるリターン分布推定 
サブタイトル(和)  
タイトル(英) Return distribution estimation with dynamic programming 
サブタイトル(英)  
キーワード(1)(和/英) /  
キーワード(2)(和/英) /  
キーワード(3)(和/英) /  
キーワード(4)(和/英) /  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 森村 哲郎 / Tetsuro Morimura / モリムラ テツロウ
第1著者 所属(和/英) 日本アイ・ビー・エム株式会社 (略称: 日本IBM)
IBM Japan, Ltd. (略称: IBM Japan)
第2著者 氏名(和/英/ヨミ) 杉山 将 / Masashi Sugiyama / スギヤマ マサシ
第2著者 所属(和/英) 東京工業大学 (略称: 東工大)
Tokyo Institute of Technology (略称: Tokyo Tech)
第3著者 氏名(和/英/ヨミ) 鹿島 久嗣 / Hisashi Kashima / カシマ ヒサシ
第3著者 所属(和/英) 東京大学 (略称: 東大)
The University of Tokyo (略称: Univ. of Tokyo)
第4著者 氏名(和/英/ヨミ) 八谷 大岳 / Hirotaka Hachiya / ハチヤ ヒロタカ
第4著者 所属(和/英) 東京工業大学 (略称: 東工大)
Tokyo Institute of Technology (略称: Tokyo Tech)
第5著者 氏名(和/英/ヨミ) 田中 利幸 / Toshiyuki Tanaka / タナカ トシユキ
第5著者 所属(和/英) 京都大学 (略称: 京大)
Kyoto University (略称: Kyoto Univ.)
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2010-11-05 15:30:00 
発表時間 180分 
申込先研究会 IBISML 
資料番号 IBISML2010-98 
巻番号(vol) vol.110 
号番号(no) no.265 
ページ範囲 pp.283-290 
ページ数
発行日 2010-10-28 (IBISML) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会