電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
技報オンライン
‥‥ (ESS/通ソ/エレソ/ISS)
技報アーカイブ
‥‥ (エレソ/通ソ)
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2011-06-24 16:30
Solving POMDPs using Restricted Boltzmann Machines with Echo State Networks
Makoto OtsukaJunichiro YoshimotoStefan ElfwingKenji DoyaOISTNC2011-19
抄録 (和) 部分観測マルコフ決定過程(POMDP)により定式化される
環境下において最適な行動選択を実現するための
アプローチには、環境のダイナミクスに関する事前知識を利用するモデルベースなアプローチと、それらを必要としないモデルフリーなアプローチがある。本研究では、エコーステートネット-ワーク(ESN)と制限付きボルツマンマシン(RBM)を組み合わせたモデルフリーな手法を提案する。シミュレーター上で行ったロボットナビゲーションタスクの結果、提案手法が、エコーステートネットワークの持つ長期予測能力と制限付きのボルツマンマシンの持つ高次元入力に対するロバスト性を合わせ持つことが示された。また、ESN の隠れ層がタスクに必要となる過去の情報を高次元入力から抽出し保持していること、RBM の隠れ層がタスク依存な情報表現をしていることなどが示された。 
(英) A partially observable Markov decision process (POMDP) can be solved in a model-based way using explicit knowledge of the environmental dynamics or in a model-free way using implicit representations of task-relevant states. Here we consider a model-free approach of combining an echo state network (ESN) for summarizing past actions and observations and a restricted Boltzmann machine (RBM) for learning action values in a high-dimensional state space. Simulation results in robot navigation tasks showed that the ESN can capture relevant information in the sequence of high dimensional observations and that RBM can construct task-oriented internal representation in its hidden layer.
キーワード (和) 部分観測マルコフ決定過程 / 制限付きボルツマンマシン / エコーステートネットワーク / 目的指向的内部表現 / 自由エネルギー / / /  
(英) partially observable Markov decision processes / restricted Boltzmann machines / echo state networks / goal-directed representation / free energy / / /  
文献情報 信学技報, vol. 111, no. 96, NC2011-19, pp. 143-148, 2011年6月.
資料番号 NC2011-19 
発行日 2011-06-16 (NC) 
ISSN Print edition: ISSN 0913-5685  Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード NC2011-19

研究会情報
研究会 NC IPSJ-BIO  
開催期間 2011-06-23 - 2011-06-24 
開催地(和) 琉球大学 50周年記念館 
開催地(英) 50th Anniversary Memorial Hall, University of the Ryukyus 
テーマ(和) 機械学習によるバイオデータマインニング,一般 
テーマ(英) Machine Learning Approach to Biodata Mining, and General 
講演論文情報の詳細
申込み研究会 NC 
会議コード 2011-06-NC-BIO 
本文の言語 英語 
タイトル(和)  
サブタイトル(和)  
タイトル(英) Solving POMDPs using Restricted Boltzmann Machines with Echo State Networks 
サブタイトル(英)  
キーワード(1)(和/英) 部分観測マルコフ決定過程 / partially observable Markov decision processes  
キーワード(2)(和/英) 制限付きボルツマンマシン / restricted Boltzmann machines  
キーワード(3)(和/英) エコーステートネットワーク / echo state networks  
キーワード(4)(和/英) 目的指向的内部表現 / goal-directed representation  
キーワード(5)(和/英) 自由エネルギー / free energy  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 大塚 誠 / Makoto Otsuka / オオツカ マコト
第1著者 所属(和/英) 沖縄科学技術大学院大学 (略称: 沖縄科技大)
Okinawa Institute of Science and Technology (略称: OIST)
第2著者 氏名(和/英/ヨミ) 吉本 潤一郎 / Junichiro Yoshimoto / ヨシモト ジュンイチロウ
第2著者 所属(和/英) 沖縄科学技術大学院大学 (略称: 沖縄科技大)
Okinawa Institute of Science and Technology (略称: OIST)
第3著者 氏名(和/英/ヨミ) エルフィング ステファン / Stefan Elfwing /
第3著者 所属(和/英) 沖縄科学技術大学院大学 (略称: 沖縄科技大)
Okinawa Institute of Science and Technology (略称: OIST)
第4著者 氏名(和/英/ヨミ) 銅谷 賢治 / Kenji Doya /
第4著者 所属(和/英) 沖縄科学技術大学院大学 (略称: 沖縄科技大)
Okinawa Institute of Science and Technology (略称: OIST)
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者
発表日時 2011-06-24 16:30:00 
発表時間 25 
申込先研究会 NC 
資料番号 IEICE-NC2011-19 
巻番号(vol) IEICE-111 
号番号(no) no.96 
ページ範囲 pp.143-148 
ページ数 IEICE-6 
発行日 IEICE-NC-2011-06-16 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会