マルチエージェントゲームにおける深層強化学習の報酬配分

渡邉 慧; 橘 俊宏

講演名	2018-12-23 マルチエージェントゲームにおける深層強化学習の報酬配分渡邉慧(湘南工科大), 橘俊宏(湘南工科大),
PDFダウンロードページ	PDFダウンロードページへ
抄録(和)	本稿では，複数のエージェントが協力し合うマルチエージェントシステムに深層強化学習を適用する．我々は，このようなシステムに対して深層強化学習により学習させた結果について実験的に検証を行った．本稿では学習環境の構築やエージェントアーキテクチャにおいてユニティテクノロジーズが公開しているゲームエンジン "Unity" と機械学習フレームワーク "UnityML-Agents" を用いる．本稿において対象とする環境はマルチエージェントが点を取り合うゲームである．深層強化学習を用いてエージェントを学習させた場合の報酬の与え方とエージェントのふるまいの関係を実験的に検証した．その結果を中心に報告する．
抄録(英)	In this paper, we consider a method to realize multi agent system with multiple agents cooperating by deep reinforcement learning. Furthermore, we conduct simulation experiments. Here we use the game engine "Unity" published by Unity Technologies and the machine learning framework "UnityML-Agents". We will use it to build a learning environment and create an agent architecture. The target environment here is a game where multiple agents keep points. We experimentally verified the learning method of the inference model which manipulates the agent using deep reinforcement learning, the relationship of how to give the reward and the behavior. In this paper, we report on the results.
キーワード(和)	深層強化学習 / マルチエージェント / 報酬 / Unity ML-Agents / TensorFlow
キーワード(英)	Deep reinforcement learning / Multi-agents / Reward / Unity ML-Agents / TensorFlow
資料番号	CAS2018-107,ICD2018-91,CPSY2018-73
発行日	2018-12-14 (CAS, ICD, CPSY)

研究会情報
研究会	ICD / CPSY / CAS
開催期間	2018/12/21(から3日開催)
開催地（和）	ホテルアトールエメラルド宮古島
開催地（英）
テーマ（和）	学生・若手研究会
テーマ（英）
委員長氏名（和）	日高秀人(ルネサスエレクトロニクス) / 中野浩嗣(広島大) / 岡崎秀晃(湘南工科大)
委員長氏名（英）	Hideto Hidaka(Renesas) / Koji Nakano(Hiroshima Univ.) / Hideaki Okazaki(Shonan Inst. of Tech.)
副委員長氏名（和）	永田真(神戸大) / 入江英嗣(東大) / 三吉貴史(富士通研) / 山脇大造(日立)
副委員長氏名（英）	Makoto Nagata(Kobe Univ.) / Hidetsugu Irie(Univ. of Tokyo) / Takashi Miyoshi(Fujitsu) / Taizo Yamawaki(Hitachi)
幹事氏名（和）	橋本隆(パナソニック) / 夏井雅典(東北大) / 大川猛(宇都宮大) / 高前田伸也(北大) / 橘俊宏(湘南工科大) / 中村洋平(日立)
幹事氏名（英）	Takashi Hashimoto(Panasonic) / Masanori Natsui(Tohoku Univ.) / Takeshi Ohkawa(Utsunomiya Univ.) / Shinya Takameda(Hokkaido Univ.) / Toshihiro Tachibana(Shonan Inst. of Tech.) / Yohei Nakamura(Hitachi)
幹事補佐氏名（和）	伊藤浩之(東工大) / 柘植政利(ソシオネクスト) / 廣瀬哲也(神戸大) / 伊藤靖朗(広島大) / 津邑公暁(名工大) / 山口基(ルネサスエレクトロニクス)
幹事補佐氏名（英）	Hiroyuki Ito(Tokyo Inst. of Tech.) / Masatoshi Tsuge(Socionext) / Tetsuya Hirose(Kobe Univ.) / Yasuaki Ito(Hiroshima Univ.) / Tomoaki Tsumura(Nagoya Inst. of Tech.) / Motoi Yamaguchi(Renesas Electronics)

講演論文情報詳細
申込み研究会	Technical Committee on Integrated Circuits and Devices / Technical Committee on Computer Systems / Technical Committee on Circuits and Systems
本文の言語	JPN
タイトル（和）	マルチエージェントゲームにおける深層強化学習の報酬配分
サブタイトル（和）
タイトル（英）	On Reward Sharing for Multi-agent Games Using Deep Reinforcement Learning
サブタイトル（和）
キーワード(1)（和/英）	深層強化学習 / Deep reinforcement learning
キーワード(2)（和/英）	マルチエージェント / Multi-agents
キーワード(3)（和/英）	報酬 / Reward
キーワード(4)（和/英）	Unity ML-Agents / Unity ML-Agents
キーワード(5)（和/英）	TensorFlow / TensorFlow
第 1 著者氏名（和/英）	渡邉慧 / Kei Watanabe
第 1 著者所属（和/英）	湘南工科大学(略称：湘南工科大) Shonan Institute of Technology(略称：Shonan Isnt. of Tech.)
第 2 著者氏名（和/英）	橘俊宏 / Toshihiro Tachibana
第 2 著者所属（和/英）	湘南工科大学(略称：湘南工科大) Shonan Institute of Technology(略称：Shonan Isnt. of Tech.)
発表年月日	2018-12-23
資料番号	CAS2018-107,ICD2018-91,CPSY2018-73
巻番号（vol）	vol.118
号番号（no）	CAS-373,ICD-374,CPSY-375
ページ範囲	pp.109-114(CAS), pp.109-114(ICD), pp.109-114(CPSY),
ページ数	6
発行日	2018-12-14 (CAS, ICD, CPSY)