大会名称
2022年 情報科学技術フォーラム(FIT)
大会コ-ド
F
開催年
2022
発行日
2022-08-30
セッション番号
1e
セッション名
人工知能・ゲーム
講演日
2022/09/13
講演場所(会議室等)
12棟-105教室
講演番号
CF-002
タイトル
二人零和ゲームにおける突然変異駆動型Follow-The-Regularized-Leaderの終極反復収束
著者名
豊島健太郎阿部拳之坂本充生岩崎 敦
キーワード
エージェント, 機械学習
抄録
本研究では,二人零和ゲームにおけるFollow the Regularized Leader (FTRL) に突然変異を導入したアルゴリズムを提案する.FTRLを始めとする既存アルゴリズムの多くのナッシュ均衡への収束は,その戦略を時間平均しなければならない.このため,関数近似を必要とする問題への適用が難しくなる.そこで,突然変異項を導入した突然変異駆動型FTRL (Mutant-Driven FTRL)を提案する.まず,この連続時間のダイナミクスが突然変異付きレプリケータダイナミクスと等価になることを示した.次に,ダイナミクスが近似ナッシュ均衡となる定常点へ戦略の時間平均をとらなくても収束することを示した.さらに同様の性質をもつ楽観的FTRL (Optimistic FTRL) より早く収束することを実験的に示した.
本文pdf
PDF download (1.9MB)