優先度の存在する領域における強化学習を用いたマルチエージェントパトロール手法

小瀬木,晴信; 杉山,歩未; 菅原,俊治

お知らせ 2023年度・2024年度学生員会費割引キャンペーン実施中です
お知らせ技術研究報告と和文論文誌Ｃの同時投稿施策(掲載料1割引き)について
お知らせ電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について

電子情報通信学会研究会発表申込システム
講演論文詳細

技報閲覧サービス
[ログイン]
技報アーカイブ

トップに戻る

前のページに戻る

[Japanese] / [English]

講演抄録／キーワード
講演名		2016-12-09 16:40 優先度の存在する領域における強化学習を用いたマルチエージェントパトロール手法 ○小瀬木晴信・杉山歩未・菅原俊治（早大） AI2016-21
抄録	（和）	本研究では, マルチエージェントによるパトロール問題において, 対象領域に優先度が存在する場合に強化学習により効率よくパトロールを行う手法を提案する. 複数エージェントが同一の領域をパトロールする場合, 各エージェントが協調行動を取ることが効率よくパトロールを行う上で必要である. このような問題をMarkov Decision Processとしてモデル化し, 強化学習を用いて効率的なパトロールを行う研究がある. しかし, この手法はパトロールすべき場所の優先度を考慮していない. そこで, 本研究では既存のモデルを優先度を考慮したモデルに拡張し, その上で効率的にパトロールを行う手法を提案する. 計算機上でグリットグラフで表される領域のパトロールのシミュレーション実験を行い, 提案手法の有用性を示す.
	（英）	We propose a multi-agent patrolling method in an environment with priority. Cooperative behavior is required that a team of agents patrols an area effectively. In previous work, patrolling task was modeled as a Markov Decision Process and solved by Q-learning. However, this model did not take into account the patrol area consisting of regions with different priority. In this paper, we have extended the previous model to include priority setting and propose a method to patrol effectively in that environment in a cooperative manner. Then we experimentally indicate the effectiveness of our proposed method.
キーワード	（和）	マルチエージェント / Q学習 / パトロール / / / / /
	（英）	Multi-agent / Q-learning / Patrol / / / / /
文献情報		信学技報, vol. 116, no. 350, AI2016-21, pp. 49-54, 2016年12月.
資料番号		AI2016-21
発行日		2016-12-02 (AI)
ISSN		Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380
著作権について		技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します．(許諾番号：10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード		AI2016-21

研究会情報
研究会	AI
開催期間	2016-12-09 - 2016-12-09
開催地（和）	健康温泉館クアージュゆふいん
開催地（英）
テーマ（和）	「コンテキストを意識した知識の利用」および一般
テーマ（英）
講演論文情報の詳細
申込み研究会	AI
会議コード	2016-12-AI
本文の言語	日本語
タイトル（和）	優先度の存在する領域における強化学習を用いたマルチエージェントパトロール手法
サブタイトル（和）
タイトル（英）	Applying reinforcement learning to multi-agent patrolling with priority setting
サブタイトル（英）
キーワード(1)（和/英）	マルチエージェント / Multi-agent
キーワード(2)（和/英）	Q学習 / Q-learning
キーワード(3)（和/英）	パトロール / Patrol
キーワード(4)（和/英）	/
キーワード(5)（和/英）	/
キーワード(6)（和/英）	/
キーワード(7)（和/英）	/
キーワード(8)（和/英）	/
第1著者氏名（和/英/ヨミ）	小瀬木晴信 / Harunobu Ozeki / オゼキハルノブ
第1著者所属（和/英）	早稲田大学 (略称：早大) Waseda University (略称： Waseda Univ.)
第2著者氏名（和/英/ヨミ）	杉山歩未 / Ayumi Sugiyama / スギヤマアユミ
第2著者所属（和/英）	早稲田大学 (略称：早大) Waseda University (略称： Waseda Univ.)
第3著者氏名（和/英/ヨミ）	菅原俊治 / Toshiharu Sugawara /
第3著者所属（和/英）	早稲田大学 (略称：早大) Waseda University (略称： Waseda Univ.)
第4著者氏名（和/英/ヨミ）	/ /
第4著者所属（和/英）	(略称： ) (略称： )
第5著者氏名（和/英/ヨミ）	/ /
第5著者所属（和/英）	(略称： ) (略称： )
第6著者氏名（和/英/ヨミ）	/ /
第6著者所属（和/英）	(略称： ) (略称： )
第7著者氏名（和/英/ヨミ）	/ /
第7著者所属（和/英）	(略称： ) (略称： )
第8著者氏名（和/英/ヨミ）	/ /
第8著者所属（和/英）	(略称： ) (略称： )
第9著者氏名（和/英/ヨミ）	/ /
第9著者所属（和/英）	(略称： ) (略称： )
第10著者氏名（和/英/ヨミ）	/ /
第10著者所属（和/英）	(略称： ) (略称： )
第11著者氏名（和/英/ヨミ）	/ /
第11著者所属（和/英）	(略称： ) (略称： )
第12著者氏名（和/英/ヨミ）	/ /
第12著者所属（和/英）	(略称： ) (略称： )
第13著者氏名（和/英/ヨミ）	/ /
第13著者所属（和/英）	(略称： ) (略称： )
第14著者氏名（和/英/ヨミ）	/ /
第14著者所属（和/英）	(略称： ) (略称： )
第15著者氏名（和/英/ヨミ）	/ /
第15著者所属（和/英）	(略称： ) (略称： )
第16著者氏名（和/英/ヨミ）	/ /
第16著者所属（和/英）	(略称： ) (略称： )
第17著者氏名（和/英/ヨミ）	/ /
第17著者所属（和/英）	(略称： ) (略称： )
第18著者氏名（和/英/ヨミ）	/ /
第18著者所属（和/英）	(略称： ) (略称： )
第19著者氏名（和/英/ヨミ）	/ /
第19著者所属（和/英）	(略称： ) (略称： )
第20著者氏名（和/英/ヨミ）	/ /
第20著者所属（和/英）	(略称： ) (略称： )
講演者	第1著者
発表日時	2016-12-09 16:40:00
発表時間	25分
申込先研究会	AI
資料番号	AI2016-21
巻番号（vol）	vol.116
号番号（no）	no.350
ページ範囲	pp.49-54
ページ数	6
発行日	2016-12-02 (AI)

[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]

IEICE / 電子情報通信学会