ドットイートゲームへのQ学習の適用

◎森田隆弘; 細部博史

大会名称
年総合大会
大会コ－ド
2021G
開催年
2021
発行日
2021-02-23
セッション番号
D-8
セッション名
人工知能と知識処理
講演日
2021/3/11
講演場所(会議室等)
Meeting　22
講演番号
D-8-18
タイトル
ドットイートゲームへのQ学習の適用
著者名
◎森田隆弘, 細部博史,
キーワード
Q学習
抄録
ゲームAIの多くで，機械学習の一つである強化学習が頻繁に活用される．強化学習で主流の一つとなっているのがQ学習である．また，Q学習で連続した空間を扱うようにしたものがファジイQ学習である．先行研究ではドットイートゲームの一つである，Ms. PacManにこのファジイQ学習を用いることにより，ある程度のスコアを出す結果が得られた．しかし，この研究ではQ学習の特徴から，価値推定関数であるQ値が最大のものを選び続けてしまうことで局所解が生まれ，Q値を十分に更新することができなかった．本研究では，以上の課題を解決するためにファジイQ学習とUCBQアルゴリズムを組み合わせたUCBファジイQ学習を提案しMs. PacManに適用して先行研究との比較を行う．
本文pdf
PDF download PayPerView