お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2016-11-17 14:00
幾何学的双対表現を用いた部分観測マルコフ決定過程の近似的価値反復アルゴリズム
塚原裕史安倍 満大林真人デンソーアイティーラボラトリIBISML2016-71
抄録 (和) 部分観測マルコフ決定過程(POMDP) の価値関数は,価値反復の再帰計算で現れる信念空間上の線形関数の集合の最大値を取った区分線形な凸関数によって表されるが,これらの線形関数をそれらの係数ベクトルの空間における点群へ写像した時,これらの点群の凸包上辺に対応することが知られている.本研究では,非負値行列因子分解を用いて凸包を近似計算する手法を利用し,双対空間においてPOMDP の価値関数を高速に近似計算する手法を提案する. 
(英) We propose new approximate algorithms for the value iteration of partially observable Markov decision
processes (POMDPs) in the dual representation. The value function of a POMDP can be obtained by solving the dynamic programming procedure iteratively and its form is known to be given by a piecewise linear and convex function.
The set of those linear functions can be mapped to a set of points by the duality transformations. In the dual space,
the value iteration can be solved by calculating the upper convex hull for the set of those points. Our algorithms
rely on this property and perform the value iteration by approximate calculation of convex hulls and approximate
extraction of their upper hulls by direction sampling, which can be regarded as a dual representation counterpart of
the belief sampling in the primal representation.
キーワード (和) 部分観測マルコフ決定過程 / 幾何学的双対変換 / 非負値行列因子分解 / / / / /  
(英) Partially observable Markov decision Processes / duality transformation / non-negative matrix decomposition / / / / /  
文献情報 信学技報, vol. 116, no. 300, IBISML2016-71, pp. 177-184, 2016年11月.
資料番号 IBISML2016-71 
発行日 2016-11-09 (IBISML) 
ISSN Print edition: ISSN 0913-5685    Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード IBISML2016-71

研究会情報
研究会 IBISML  
開催期間 2016-11-16 - 2016-11-18 
開催地(和) 京都大学 
開催地(英) Kyoto Univ. 
テーマ(和) 情報論的学習理論ワークショップ(IBIS2016) 
テーマ(英) Information-Based Induction Science Workshop (IBIS2016) 
講演論文情報の詳細
申込み研究会 IBISML 
会議コード 2016-11-IBISML 
本文の言語 日本語 
タイトル(和) 幾何学的双対表現を用いた部分観測マルコフ決定過程の近似的価値反復アルゴリズム 
サブタイトル(和)  
タイトル(英) Approximate Value Iteration Algorithms for Partially Observable Markov Decision Processes in Geometric Dual Representation 
サブタイトル(英)  
キーワード(1)(和/英) 部分観測マルコフ決定過程 / Partially observable Markov decision Processes  
キーワード(2)(和/英) 幾何学的双対変換 / duality transformation  
キーワード(3)(和/英) 非負値行列因子分解 / non-negative matrix decomposition  
キーワード(4)(和/英) /  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 塚原 裕史 / Hiroshi Tsukahara / ツカハラ ヒロシ
第1著者 所属(和/英) 株式会社デンソーアイティーラボラトリ (略称: デンソーアイティーラボラトリ)
Denso IT Laboratory, Inc. (略称: Denso IT Lab.)
第2著者 氏名(和/英/ヨミ) 安倍 満 / Mitsuru Anbai /
第2著者 所属(和/英) 株式会社デンソーアイティーラボラトリ (略称: デンソーアイティーラボラトリ)
Denso IT Laboratory, Inc. (略称: Denso IT Lab.)
第3著者 氏名(和/英/ヨミ) 大林 真人 / Makoto Oobayashi /
第3著者 所属(和/英) 株式会社デンソーアイティーラボラトリ (略称: デンソーアイティーラボラトリ)
Denso IT Laboratory, Inc. (略称: Denso IT Lab.)
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2016-11-17 14:00:00 
発表時間 180分 
申込先研究会 IBISML 
資料番号 IBISML2016-71 
巻番号(vol) vol.116 
号番号(no) no.300 
ページ範囲 pp.177-184 
ページ数
発行日 2016-11-09 (IBISML) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会