大会名称 |
---|
年 総合大会 |
大会コ-ド |
2021G |
開催年 |
2021 |
発行日 |
2021-02-23 |
セッション番号 |
D-8 |
セッション名 |
人工知能と知識処理 |
講演日 |
2021/3/11 |
講演場所(会議室等) |
Meeting 22 |
講演番号 |
D-8-18 |
タイトル |
ドットイートゲームへのQ学習の適用 |
著者名 |
◎森田隆弘, 細部博史, |
キーワード |
Q学習 |
抄録 |
ゲームAIの多くで,機械学習の一つである強化学習が頻繁に活用される.強化学習で主流の一つとなっているのがQ学習である.また,Q学習で連続した空間を扱うようにしたものがファジイQ学習である.先行研究ではドットイートゲームの一つである,Ms. PacManにこのファジイQ学習を用いることにより,ある程度のスコアを出す結果が得られた.しかし,この研究ではQ学習の特徴から,価値推定関数であるQ値が最大のものを選び続けてしまうことで局所解が生まれ,Q値を十分に更新することができなかった.本研究では,以上の課題を解決するためにファジイQ学習とUCBQアルゴリズムを組み合わせたUCBファジイQ学習を提案しMs. PacManに適用して先行研究との比較を行う. |
本文pdf |
PDF download
|