大会名称 |
---|
2017年 総合大会 |
大会コ-ド |
2017G |
開催年 |
2017 |
発行日 |
セッション番号 |
D-20 |
セッション名 |
情報論的学習理論と機械学習 |
講演日 |
2017/3/23 |
講演場所(会議室等) |
共通講義棟東 402 |
講演番号 |
D-20-10 |
タイトル |
エージェントの行動戦略を切り替えるマルチエージェント強化学習システムの提案 |
著者名 |
◎岸本知紘, 山崎憲一, |
キーワード |
並行強化学習, Q学習, k確実探査法, 政策反復法, マルチエージェント |
抄録 |
マルチエージェント強化学習について、2種類のエージェントすなわち報酬獲得エージェントと探索エージェントの行動戦略を切り替えることで、学習開始時に発生しやすい報酬獲得エージェントと他エージェントとの行動選択の重複を減らすエージェントの改良方式を提案する。学習開始時のエージェントを全て探索エージェントとし、学習環境を十分に探索したとエージェントが判断できた時、1つのエージェントを報酬獲得エージェントに切り替える。これにより学習開始時は探索エージェントのみなので、行動選択の重複が少なくなると考えられる。また、学習収束時には切り替えにより報酬獲得エージェントになったエージェントが最適な行動を行える。 |
本文pdf |
PDF download
|