講演名 | 2006-03-15 Online Profit Sharingにおける計算量を削減するアルゴリズムの提案 長谷見 健太郎, 須鎗 弘樹, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 従来のProfit Sharing (Off-PS)はオフライン更新型であり,選択した状態行動対をすべて記憶する必要がある.そのため,使用するメモリ量に上限がなくなってしまう欠点がある.それを改善したのが,オンライン更新型PS (On-PS)である.このOn-PSでは,従来のOff-PSと等価ながら,メモリ量を有限とすることができる.しかし,On-PSでは計算時間がOff-PSよりもはるかに大きくなってしまう問題がある.そこで,本研究ではOn-PSで計算時間を減らす方法を提案し,計算量が大幅に減少することを理論的に述べる.また,Acrobot ProblemにOff-PS,On-PS,提案法を実装することによって,メモリ量や計算時間の観点からの比較し,提案手法の有効性を示す. |
抄録(英) | We propose a new algorithm for on-line profit-sharing (On-PS for simplicity) in order to reduce the computational complexity in the profit-sharing algorithms. The original profit-sharing algorithm (we call it Off-PS in contrast to On-PS) requires "unbounded" memory space to store all of the selected state-action pairs after an episode ends for a given problem. On the other hand, On-PS solves the above problem on memory space, but it requires much more computational steps than Off-PS. Our algorithm solves these problems in memory space and computational steps which are shown in theoretical and experimental aspects. |
キーワード(和) | Profit Sharing / Online Profit Sharing / 計算時間 / メモリ量 / 計算量 |
キーワード(英) | Profit Sharing / Online Profit Sharing / Computational complexitym / Memory space / Computational steps |
資料番号 | NC2005-123 |
発行日 |
研究会情報 | |
研究会 | NC |
---|---|
開催期間 | 2006/3/8(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Neurocomputing (NC) |
---|---|
本文の言語 | JPN |
タイトル(和) | Online Profit Sharingにおける計算量を削減するアルゴリズムの提案 |
サブタイトル(和) | |
タイトル(英) | A proposal of algorithm that reduces computational complexity for Online Profit Sharing |
サブタイトル(和) | |
キーワード(1)(和/英) | Profit Sharing / Profit Sharing |
キーワード(2)(和/英) | Online Profit Sharing / Online Profit Sharing |
キーワード(3)(和/英) | 計算時間 / Computational complexitym |
キーワード(4)(和/英) | メモリ量 / Memory space |
キーワード(5)(和/英) | 計算量 / Computational steps |
第 1 著者 氏名(和/英) | 長谷見 健太郎 / Kentarou HASEMI |
第 1 著者 所属(和/英) | 千葉大学大学院自然科学研究科 Chiba University Graduate School of Science and Technology |
第 2 著者 氏名(和/英) | 須鎗 弘樹 / Hiroki SUYARI |
第 2 著者 所属(和/英) | 千葉大学工学部 Chiba University Faculty of Engeneering |
発表年月日 | 2006-03-15 |
資料番号 | NC2005-123 |
巻番号(vol) | vol.105 |
号番号(no) | 657 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |