講演名 2018-12-23
マルチエージェントゲームにおける深層強化学習の報酬配分
渡邉 慧(湘南工科大), 橘 俊宏(湘南工科大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿では,複数のエージェントが協力し合うマルチエージェントシステムに深層強化学習を適用する.我々は,このようなシステムに対して深層強化学習により学習させた結果について実験的に検証を行った.本稿では学習環境の構築やエージェントアーキテクチャにおいてユニティテクノロジーズが公開しているゲームエンジン "Unity" と機械学習フレームワーク "UnityML-Agents" を用いる.本稿において対象とする環境はマルチエージェントが点を取り合うゲームである.深層強化学習を用いてエージェントを学習させた場合の報酬の与え方とエージェントのふるまいの関係を実験的に検証した.その結果を中心に報告する.
抄録(英) In this paper, we consider a method to realize multi agent system with multiple agents cooperating by deep reinforcement learning. Furthermore, we conduct simulation experiments. Here we use the game engine "Unity" published by Unity Technologies and the machine learning framework "UnityML-Agents". We will use it to build a learning environment and create an agent architecture. The target environment here is a game where multiple agents keep points. We experimentally verified the learning method of the inference model which manipulates the agent using deep reinforcement learning, the relationship of how to give the reward and the behavior. In this paper, we report on the results.
キーワード(和) 深層強化学習 / マルチエージェント / 報酬 / Unity ML-Agents / TensorFlow
キーワード(英) Deep reinforcement learning / Multi-agents / Reward / Unity ML-Agents / TensorFlow
資料番号 CAS2018-107,ICD2018-91,CPSY2018-73
発行日 2018-12-14 (CAS, ICD, CPSY)

研究会情報
研究会 ICD / CPSY / CAS
開催期間 2018/12/21(から3日開催)
開催地(和) ホテルアトールエメラルド宮古島
開催地(英)
テーマ(和) 学生・若手研究会
テーマ(英)
委員長氏名(和) 日高 秀人(ルネサス エレクトロニクス) / 中野 浩嗣(広島大) / 岡崎 秀晃(湘南工科大)
委員長氏名(英) Hideto Hidaka(Renesas) / Koji Nakano(Hiroshima Univ.) / Hideaki Okazaki(Shonan Inst. of Tech.)
副委員長氏名(和) 永田 真(神戸大) / 入江 英嗣(東大) / 三吉 貴史(富士通研) / 山脇 大造(日立)
副委員長氏名(英) Makoto Nagata(Kobe Univ.) / Hidetsugu Irie(Univ. of Tokyo) / Takashi Miyoshi(Fujitsu) / Taizo Yamawaki(Hitachi)
幹事氏名(和) 橋本 隆(パナソニック) / 夏井 雅典(東北大) / 大川 猛(宇都宮大) / 高前田 伸也(北大) / 橘 俊宏(湘南工科大) / 中村 洋平(日立)
幹事氏名(英) Takashi Hashimoto(Panasonic) / Masanori Natsui(Tohoku Univ.) / Takeshi Ohkawa(Utsunomiya Univ.) / Shinya Takameda(Hokkaido Univ.) / Toshihiro Tachibana(Shonan Inst. of Tech.) / Yohei Nakamura(Hitachi)
幹事補佐氏名(和) 伊藤 浩之(東工大) / 柘植 政利(ソシオネクスト) / 廣瀬 哲也(神戸大) / 伊藤 靖朗(広島大) / 津邑 公暁(名工大) / 山口 基(ルネサスエレクトロニクス)
幹事補佐氏名(英) Hiroyuki Ito(Tokyo Inst. of Tech.) / Masatoshi Tsuge(Socionext) / Tetsuya Hirose(Kobe Univ.) / Yasuaki Ito(Hiroshima Univ.) / Tomoaki Tsumura(Nagoya Inst. of Tech.) / Motoi Yamaguchi(Renesas Electronics)

講演論文情報詳細
申込み研究会 Technical Committee on Integrated Circuits and Devices / Technical Committee on Computer Systems / Technical Committee on Circuits and Systems
本文の言語 JPN
タイトル(和) マルチエージェントゲームにおける深層強化学習の報酬配分
サブタイトル(和)
タイトル(英) On Reward Sharing for Multi-agent Games Using Deep Reinforcement Learning
サブタイトル(和)
キーワード(1)(和/英) 深層強化学習 / Deep reinforcement learning
キーワード(2)(和/英) マルチエージェント / Multi-agents
キーワード(3)(和/英) 報酬 / Reward
キーワード(4)(和/英) Unity ML-Agents / Unity ML-Agents
キーワード(5)(和/英) TensorFlow / TensorFlow
第 1 著者 氏名(和/英) 渡邉 慧 / Kei Watanabe
第 1 著者 所属(和/英) 湘南工科大学(略称:湘南工科大)
Shonan Institute of Technology(略称:Shonan Isnt. of Tech.)
第 2 著者 氏名(和/英) 橘 俊宏 / Toshihiro Tachibana
第 2 著者 所属(和/英) 湘南工科大学(略称:湘南工科大)
Shonan Institute of Technology(略称:Shonan Isnt. of Tech.)
発表年月日 2018-12-23
資料番号 CAS2018-107,ICD2018-91,CPSY2018-73
巻番号(vol) vol.118
号番号(no) CAS-373,ICD-374,CPSY-375
ページ範囲 pp.109-114(CAS), pp.109-114(ICD), pp.109-114(CPSY),
ページ数 6
発行日 2018-12-14 (CAS, ICD, CPSY)