大会名称
2019年 情報科学技術フォーラム(FIT)
大会コ-ド
F
開催年
2019
発行日
2019-08-20
セッション番号
6j
セッション名
エージェント応用
講演日
2019/09/05
講演場所(会議室等)
一般教育棟 B棟 B11
講演番号
F-027
タイトル
強化学習エージェントの協調をもたらすN人囚人のジレンマゲームの利得関数
著者名
田口智健森山甲一武藤敦子松井藤五郎犬塚信博
キーワード
N人囚人のジレンマゲーム, 強化学習, 利得関数, マルチエージェントシステム
抄録
社会において、個人の合理的な選択が社会全体の利益と一致せずに葛藤が生じる社会的ジレンマ問題が存在する。そのモデルであるN人囚人のジレンマゲームでは、N人のプレイヤーが与えられた利得関数に基づき、同時に協調または裏切りの行動を選択する。しかし、現実社会では利得関数が与えられているとは限らず、環境における相互作用から行動を学習していく。本研究では、利得関数を知らないエージェントにN人囚人のジレンマゲームを行わせ、行動から得られた報酬をもとにエージェントに強化学習をさせた。この時N人囚人のジレンマゲームの条件を満たしながら、強化学習エージェントが相互協調する利得関数が存在することを示した。
本文pdf
PDF download (931.6KB)