Profit Sharingを用いた強化学習の高速化に関する研究

○菅原茉理絵; 奥野祥二; 内田智史

大会名称
2016年ソサイエティ大会
大会コ－ド
2016S
開催年
2016
発行日
2016-09-06
セッション番号
A-17
セッション名
高信頼制御通信
講演日
2016/9/21
講演場所(会議室等)
工学部　N棟　N304
講演番号
A-17-8
タイトル
Profit Sharingを用いた強化学習の高速化に関する研究
著者名
○菅原茉理絵, 奥野祥二, 内田智史,
キーワード
強化学習, 機械学習, Profit Sharing
抄録
強化学習の１つであるProfit Sharingでは環境との試行錯誤的な相互作用を通して、最終的に目的を達成した際に過去の行動履歴に対して報酬が与えられる。そのため、ゴールしたエージェントにのみ報酬が反映される。また、方策の選択方法として重み付きルーレット選択が使用される。このためProfit Sharingでは負の報酬を扱うことができない。そこで本研究では、強化学習の学習高速化を目標にフィールドを探索するエージェントを従来のエージェントと併用し学習時間の高速化を行えるような手法を提案したい。
本文pdf
PDF download PayPerView