方策ベースの複利型強化学習

伊藤徳晃; 松井藤五郎

大会名称
2019年情報科学技術フォーラム(FIT)
大会コ－ド
F
開催年
2019
発行日
2019-08-20
セッション番号
6h
セッション名
機械学習（２）
講演日
2019/09/05
講演場所(会議室等)
一般教育棟 A棟 A43
講演番号
F-022
タイトル
方策ベースの複利型強化学習
著者名
伊藤徳晃, 松井藤五郎,
キーワード
強化学習, 方策勾配法
抄録
一般に高次元の空間を用いて学習させる場合や、高速に学習させたい場合は、勾配を用いてパラメータを更新し、目的関数を最適化する方策勾配法が用いられる。しかし、複利型強化学習は株式や為替の取引において有効であることが示されているが、方策勾配法を用いた複利型強化学習はこれまで提案されていない。そこで、本論文では、方策勾配法を用いた複利型強化学習を提案する。また、OpenAI gymの倒立振子 (CartPole) のシミュレーションを用いた実験結果により、提案手法の有効性を示す。
本文pdf
PDF download (266.2KB)