大会名称 |
---|
2022年 情報科学技術フォーラム(FIT) |
大会コ-ド |
F |
開催年 |
2022 |
発行日 |
2022-08-30 |
セッション番号 |
1e |
セッション名 |
人工知能・ゲーム |
講演日 |
2022/09/13 |
講演場所(会議室等) |
12棟-105教室 |
講演番号 |
CF-002 |
タイトル |
二人零和ゲームにおける突然変異駆動型Follow-The-Regularized-Leaderの終極反復収束 |
著者名 |
豊島健太郎, 阿部拳之, 坂本充生, 岩崎 敦, |
キーワード |
エージェント, 機械学習 |
抄録 |
本研究では,二人零和ゲームにおけるFollow the Regularized Leader (FTRL) に突然変異を導入したアルゴリズムを提案する.FTRLを始めとする既存アルゴリズムの多くのナッシュ均衡への収束は,その戦略を時間平均しなければならない.このため,関数近似を必要とする問題への適用が難しくなる.そこで,突然変異項を導入した突然変異駆動型FTRL (Mutant-Driven FTRL)を提案する.まず,この連続時間のダイナミクスが突然変異付きレプリケータダイナミクスと等価になることを示した.次に,ダイナミクスが近似ナッシュ均衡となる定常点へ戦略の時間平均をとらなくても収束することを示した.さらに同様の性質をもつ楽観的FTRL (Optimistic FTRL) より早く収束することを実験的に示した. |
本文pdf |
PDF download (1.9MB) |