エージェントの行動戦略を切り替えるマルチエージェント強化学習システムの提案

◎岸本知紘; 山崎憲一

大会名称
2017年総合大会
大会コ－ド
2017G
開催年
2017
発行日

セッション番号
D-20
セッション名
情報論的学習理論と機械学習
講演日
2017/3/23
講演場所(会議室等)
共通講義棟東　402
講演番号
D-20-10
タイトル
エージェントの行動戦略を切り替えるマルチエージェント強化学習システムの提案
著者名
◎岸本知紘, 山崎憲一,
キーワード
並行強化学習, Q学習, k確実探査法, 政策反復法, マルチエージェント
抄録
マルチエージェント強化学習について、2種類のエージェントすなわち報酬獲得エージェントと探索エージェントの行動戦略を切り替えることで、学習開始時に発生しやすい報酬獲得エージェントと他エージェントとの行動選択の重複を減らすエージェントの改良方式を提案する。学習開始時のエージェントを全て探索エージェントとし、学習環境を十分に探索したとエージェントが判断できた時、1つのエージェントを報酬獲得エージェントに切り替える。これにより学習開始時は探索エージェントのみなので、行動選択の重複が少なくなると考えられる。また、学習収束時には切り替えにより報酬獲得エージェントになったエージェントが最適な行動を行える。
本文pdf
PDF download PayPerView