講演名 2018-11-23
A Human-Like Agent Based on a Hybrid of Reinforcement and Imitation Learning
連 欣瑜(神戸大), ドッサ ルスラン フェルナン ジュリアン(神戸大), 野本 洋一(*), 松原 崇(神戸大), 上原 邦昭(神戸大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和)
抄録(英) Reinforcement learning (RL) makes it possible to build an efficient agent that handles tasks in complex and uncertain environments by maximizing future reward. However, for applications in some areas like game AI and autonomous driving, efficiency only cannot satisfy the practical use, and a human-like agent is preferable. On the other hand, in imitation learning (IL) tasks, which trains the agent to mimic actions of expert behavior provided as training data and thereby learns relatively complex tasks while achieving human-like behavior. Unfortunately, the performance of such an agent is generally limited by the expert behavior. Thus, with the aim of training an agent which achieves high performance while retaining a human-like behavior, we propose a method for mixing RL and IL, applicable to both discrete and continuous problems. We used state-of-the-art RL and IL algorithms and trained their respective models independently, before mixing them into the proposed hybrid model.
キーワード(和)
キーワード(英) Human-LikeHybrid ModelReinforcement LearningImitation LearningGame AIAutonomous Driving
資料番号 CCS2018-41
発行日 2018-11-15 (CCS)

研究会情報
研究会 CCS
開催期間 2018/11/22(から2日開催)
開催地(和) 神戸大学
開催地(英) Kobe Univ.
テーマ(和) 相互作用と情報伝達・情報処理,一般
テーマ(英) Interaction and Communication, etc.
委員長氏名(和) 長谷川 幹雄(東京理科大)
委員長氏名(英) Mikio Hasegawa(Tokyo Univ. of Science)
副委員長氏名(和) 成瀬 誠(NICT) / 塩川 茂樹(神奈川工科大)
副委員長氏名(英) Makoto Naruse(NICT) / Shigeki Shiokawa(Kanagawa Inst. of Tech.)
幹事氏名(和) 中野 秀洋(東京都市大) / 高野 知佐(広島市立大)
幹事氏名(英) Hidehiro Nakano(Tokyo City Univ.) / Chisa Takano(Hiroshima City Univ.)
幹事補佐氏名(和) 川喜田 佑介(神奈川工科大) / 安東 弘泰(筑波大) / 松原 崇(神戸大) / 高橋 亮(愛知工科大)
幹事補佐氏名(英) Yusuke Kawakita(Kanagawa Inst. of Tech.) / Hiroyasu Ando(Tsukuba Univ.) / Takashi Matsubara(Kobe Univ.) / Ryo Takahashi(AUT)

講演論文情報詳細
申込み研究会 Technical Committee on Complex Communication Sciences
本文の言語 ENG
タイトル(和)
サブタイトル(和)
タイトル(英) A Human-Like Agent Based on a Hybrid of Reinforcement and Imitation Learning
サブタイトル(和)
キーワード(1)(和/英) / Human-LikeHybrid ModelReinforcement LearningImitation LearningGame AIAutonomous Driving
第 1 著者 氏名(和/英) 連 欣瑜 / Xinyu Lian
第 1 著者 所属(和/英) 神戸大学(略称:神戸大)
Kobe University(略称:Kobe Univ.)
第 2 著者 氏名(和/英) ドッサ ルスラン フェルナン ジュリアン / Rousslan Fernand Julien Dossa
第 2 著者 所属(和/英) 神戸大学(略称:神戸大)
Kobe University(略称:Kobe Univ.)
第 3 著者 氏名(和/英) 野本 洋一 / Hirokazu Nomoto
第 3 著者 所属(和/英) 株式会社エクォス・リサーチ(略称:*)
EQUOS RESEARCH Co., Ltd.(略称:*)
第 4 著者 氏名(和/英) 松原 崇 / Takashi Matsubara
第 4 著者 所属(和/英) 神戸大学(略称:神戸大)
Kobe University(略称:Kobe Univ.)
第 5 著者 氏名(和/英) 上原 邦昭 / Kuniaki Uehara
第 5 著者 所属(和/英) 神戸大学(略称:神戸大)
Kobe University(略称:Kobe Univ.)
発表年月日 2018-11-23
資料番号 CCS2018-41
巻番号(vol) vol.118
号番号(no) CCS-316
ページ範囲 pp.45-50(CCS),
ページ数 6
発行日 2018-11-15 (CCS)