講演名 2018-12-07
2次元迷路課題における進化的計算を利用したマルチタスク深層強化学習
今井 翔太(電通大), 清 雄一(電通大), 田原 康之(電通大), 大須賀 昭彦(電通大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 深層強化学習においては,探索が不十分であったり,報酬がスパースである場合には最適解への収束が難しい.また,特定のタスクにおいては,探索の回数自体が限られている場合がある.したがって,解決したいタスクとは別の似たタスク(ソースタスク)で探索をして事前に学習を行うことで,解決したいタスク(ターゲットタスク)における学習を促進することが有効であると考えられる.本研究では,ソースタスクにおいて進化的計算を用いたモデルの学習を行い,ターゲットとなる様々なタスクに適用可能なモデルを作成する手法を提案する.本手法では,様々なパラメータを持った複数のニューラルネットと,それに対応するエージェントで環境の探索を行い,様々なタスクに適用可能な汎用的学習モデルの構築を行う.実験では,2D迷路課題において,ゴールの位置が異なる複数のソースタスクを仮定する.提案手法によるソースタスクの学習後,ターゲットタスクの迷路課題に対して,どれだけそのモデルが有効であるか示す.
抄録(英) In Deep reinforcement learning, it is difficult to converge when the exploration is insufficient or a reward is sparse. Besides, in a specific task, the number of exploration may be limited. Therefore, it is considered effective to learn in source tasks previously to promote leaning in the target tasks. In this research, we propose a method to train a model that can work well on variety of target tasks with Evolutionary Computation in source task. In this method, agents explore multiple environments with diverse set of neural net works to train a general model. In the experiments, we assume multiple maze source tasks. After the model training with our method in the source tasks, we shows how effective the model is for the maze tasks of the target tasks
キーワード(和) 強化学習 / 深層学習 / 深層強化学習 / 進化的計算 / マルチタスク学習 / ニューロエボリューション
キーワード(英) Reinforcement Learning / Deep Learning / Deep Reinforcement Learning / Evolutionary Computation / Multitask Leaning / Neuroevolution
資料番号 AI2018-29
発行日 2018-11-30 (AI)

研究会情報
研究会 AI
開催期間 2018/12/7(から2日開催)
開催地(和) 九州大学 伊都キャンパス
開催地(英)
テーマ(和) 「コンテキストを意識した知識の利用」および一般
テーマ(英)
委員長氏名(和) 峯 恒憲(九大)
委員長氏名(英) Tsunenori Mine(Kyushu Univ.)
副委員長氏名(和) 片上 大輔(東京工芸大) / 福田 直樹(静岡大)
副委員長氏名(英) Daisuke Katagami(Tokyo Polytechnic Univ.) / Naoki Fukuta(Shizuoka Univ.)
幹事氏名(和) 服部 宏充(立命館大) / 清 雄一(電通大)
幹事氏名(英) Hiromitsu Hattori(Ritsumeikan Univ.) / Yuichi Sei(Univ. of Electro-Comm.)
幹事補佐氏名(和) 櫻井 祐子(産総研)
幹事補佐氏名(英) Yuko Sakurai(AIST)

講演論文情報詳細
申込み研究会 Technical Committee on Artificial Intelligence and Knowledge-Based Processing
本文の言語 JPN-ONLY
タイトル(和) 2次元迷路課題における進化的計算を利用したマルチタスク深層強化学習
サブタイトル(和)
タイトル(英) Evolutionary Multitask Deep Reinforcement Learning in 2D Maze Task
サブタイトル(和)
キーワード(1)(和/英) 強化学習 / Reinforcement Learning
キーワード(2)(和/英) 深層学習 / Deep Learning
キーワード(3)(和/英) 深層強化学習 / Deep Reinforcement Learning
キーワード(4)(和/英) 進化的計算 / Evolutionary Computation
キーワード(5)(和/英) マルチタスク学習 / Multitask Leaning
キーワード(6)(和/英) ニューロエボリューション / Neuroevolution
第 1 著者 氏名(和/英) 今井 翔太 / Shota Imai
第 1 著者 所属(和/英) 電気通信大学(略称:電通大)
The University of Electro-Communications(略称:UEC)
第 2 著者 氏名(和/英) 清 雄一 / Yuichi Sei
第 2 著者 所属(和/英) 電気通信大学(略称:電通大)
The University of Electro-Communications(略称:UEC)
第 3 著者 氏名(和/英) 田原 康之 / Yasuyuki Tahara
第 3 著者 所属(和/英) 電気通信大学(略称:電通大)
The University of Electro-Communications(略称:UEC)
第 4 著者 氏名(和/英) 大須賀 昭彦 / Akihiko Ohsuga
第 4 著者 所属(和/英) 電気通信大学(略称:電通大)
The University of Electro-Communications(略称:UEC)
発表年月日 2018-12-07
資料番号 AI2018-29
巻番号(vol) vol.118
号番号(no) AI-350
ページ範囲 pp.19-24(AI),
ページ数 6
発行日 2018-11-30 (AI)