講演名 2007-03-06
Profit Sharing 強化学習法における動的強化関数の設計法
中野 秀洋, 宮内 新,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿では,Profit Sharing強化学習法において用いられる強化関数の設計法について検討する.様々な静的または動的な強化関数に対して,学習の合理性と学習効率に関しての理論的な考察を行う.また,本稿で考察する強化関数の枠組みの中で,従来法よりも簡素な動的強化関数を用いた学習法の提案も行う.いくつかの例題タスクを用いた数値実験を行い,各手法における学習性能を比較する.
抄録(英) This paper studies design of reinforcement functions in the profit sharing reinforcement learning. We gives some theoretical consideration of the learning rationality and effectivity for various static and dynamic reinforcement functions. Also, we propose a learning method using a simpler dynamic reinforcement function compared with the conventional method. This method includes the reinforcement function considered in this paper. We perform numerical experiments for some example tasks, and compare learning performances of each method.
キーワード(和) 強化学習 / 強化関数 / 経験強化型 / Profit sharing
キーワード(英) Reinforcement learning / reinforcement function / exploitation-oriented / profit sharing
資料番号 NLP2006-154
発行日

研究会情報
研究会 NLP
開催期間 2007/2/27(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Nonlinear Problems (NLP)
本文の言語 JPN
タイトル(和) Profit Sharing 強化学習法における動的強化関数の設計法
サブタイトル(和)
タイトル(英) Design of Reinforcement Functions in Profit Sharing Reinforcement Learning
サブタイトル(和)
キーワード(1)(和/英) 強化学習 / Reinforcement learning
キーワード(2)(和/英) 強化関数 / reinforcement function
キーワード(3)(和/英) 経験強化型 / exploitation-oriented
キーワード(4)(和/英) Profit sharing / profit sharing
第 1 著者 氏名(和/英) 中野 秀洋 / Hidehiro NAKANO
第 1 著者 所属(和/英) 武蔵工業大学工学部
Faculty of Engineering, Musashi Institute of Technology
第 2 著者 氏名(和/英) 宮内 新 / Arata MIYAUCHI
第 2 著者 所属(和/英) 武蔵工業大学工学部
Faculty of Engineering, Musashi Institute of Technology
発表年月日 2007-03-06
資料番号 NLP2006-154
巻番号(vol) vol.106
号番号(no) 574
ページ範囲 pp.-
ページ数 6
発行日