講演抄録/キーワード |
講演名 |
2016-12-09 16:40
優先度の存在する領域における強化学習を用いたマルチエージェントパトロール手法 ○小瀬木晴信・杉山歩未・菅原俊治(早大) AI2016-21 |
抄録 |
(和) |
本研究では, マルチエージェントによるパトロール問題において, 対象領域に優先度が存在する場合に強化学習により効率よくパトロールを行う手法を提案する. 複数エージェントが同一の領域をパトロールする場合, 各エージェントが協調行動を取ることが効率よくパトロールを行う上で必要である. このような問題をMarkov Decision Processとしてモデル化し, 強化学習を用いて効率的なパトロールを行う研究がある. しかし, この手法はパトロールすべき場所の優先度を考慮していない. そこで, 本研究では既存のモデルを優先度を考慮したモデルに拡張し, その上で効率的にパトロールを行う手法を提案する. 計算機上でグリットグラフで表される領域のパトロールのシミュレーション実験を行い, 提案手法の有用性を示す. |
(英) |
We propose a multi-agent patrolling method in an environment with priority. Cooperative behavior is required that a team of agents patrols an area effectively. In previous work, patrolling task was modeled as a Markov Decision Process and solved by Q-learning. However, this model did not take into account the patrol area consisting of regions with different priority. In this paper, we have extended the previous model to include priority setting and propose a method to patrol effectively in that environment in a cooperative manner. Then we experimentally indicate the effectiveness of our proposed method. |
キーワード |
(和) |
マルチエージェント / Q学習 / パトロール / / / / / |
(英) |
Multi-agent / Q-learning / Patrol / / / / / |
文献情報 |
信学技報, vol. 116, no. 350, AI2016-21, pp. 49-54, 2016年12月. |
資料番号 |
AI2016-21 |
発行日 |
2016-12-02 (AI) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
AI2016-21 |