大会名称 |
---|
2016年 ソサイエティ大会 |
大会コ-ド |
2016S |
開催年 |
2016 |
発行日 |
2016-09-06 |
セッション番号 |
A-17 |
セッション名 |
高信頼制御通信 |
講演日 |
2016/9/21 |
講演場所(会議室等) |
工学部 N棟 N304 |
講演番号 |
A-17-8 |
タイトル |
Profit Sharingを用いた強化学習の高速化に関する研究 |
著者名 |
○菅原茉理絵, 奥野祥二, 内田智史, |
キーワード |
強化学習, 機械学習, Profit Sharing |
抄録 |
強化学習の1つであるProfit Sharingでは環境との試行錯誤的な相互作用を通して、最終的に目的を達成した際に過去の行動履歴に対して報酬が与えられる。そのため、ゴールしたエージェントにのみ報酬が反映される。また、方策の選択方法として重み付きルーレット選択が使用される。このためProfit Sharingでは負の報酬を扱うことができない。そこで本研究では、強化学習の学習高速化を目標にフィールドを探索するエージェントを従来のエージェントと併用し学習時間の高速化を行えるような手法を提案したい。 |
本文pdf |
PDF download
|