A Human-Like Agent Based on a Hybrid of Reinforcement and Imitation Learning

講演名	2018-11-23 A Human-Like Agent Based on a Hybrid of Reinforcement and Imitation Learning 連欣瑜(神戸大), ドッサルスランフェルナンジュリアン(神戸大), 野本洋一(*), 松原崇(神戸大), 上原邦昭(神戸大),
PDFダウンロードページ	PDFダウンロードページへ
抄録(和)
抄録(英)	Reinforcement learning (RL) makes it possible to build an efficient agent that handles tasks in complex and uncertain environments by maximizing future reward. However, for applications in some areas like game AI and autonomous driving, efficiency only cannot satisfy the practical use, and a human-like agent is preferable. On the other hand, in imitation learning (IL) tasks, which trains the agent to mimic actions of expert behavior provided as training data and thereby learns relatively complex tasks while achieving human-like behavior. Unfortunately, the performance of such an agent is generally limited by the expert behavior. Thus, with the aim of training an agent which achieves high performance while retaining a human-like behavior, we propose a method for mixing RL and IL, applicable to both discrete and continuous problems. We used state-of-the-art RL and IL algorithms and trained their respective models independently, before mixing them into the proposed hybrid model.
キーワード(和)
キーワード(英)	Human-LikeHybrid ModelReinforcement LearningImitation LearningGame AIAutonomous Driving
資料番号	CCS2018-41
発行日	2018-11-15 (CCS)

研究会情報
研究会	CCS
開催期間	2018/11/22(から2日開催)
開催地（和）	神戸大学
開催地（英）	Kobe Univ.
テーマ（和）	相互作用と情報伝達・情報処理，一般
テーマ（英）	Interaction and Communication, etc.
委員長氏名（和）	長谷川幹雄(東京理科大)
委員長氏名（英）	Mikio Hasegawa(Tokyo Univ. of Science)
副委員長氏名（和）	成瀬誠(NICT) / 塩川茂樹(神奈川工科大)
副委員長氏名（英）	Makoto Naruse(NICT) / Shigeki Shiokawa(Kanagawa Inst. of Tech.)
幹事氏名（和）	中野秀洋(東京都市大) / 高野知佐(広島市立大)
幹事氏名（英）	Hidehiro Nakano(Tokyo City Univ.) / Chisa Takano(Hiroshima City Univ.)
幹事補佐氏名（和）	川喜田佑介(神奈川工科大) / 安東弘泰(筑波大) / 松原崇(神戸大) / 高橋亮(愛知工科大)
幹事補佐氏名（英）	Yusuke Kawakita(Kanagawa Inst. of Tech.) / Hiroyasu Ando(Tsukuba Univ.) / Takashi Matsubara(Kobe Univ.) / Ryo Takahashi(AUT)

講演論文情報詳細
申込み研究会	Technical Committee on Complex Communication Sciences
本文の言語	ENG
タイトル（和）
サブタイトル（和）
タイトル（英）	A Human-Like Agent Based on a Hybrid of Reinforcement and Imitation Learning
サブタイトル（和）
キーワード(1)（和/英）	/ Human-LikeHybrid ModelReinforcement LearningImitation LearningGame AIAutonomous Driving
第 1 著者氏名（和/英）	連欣瑜 / Xinyu Lian
第 1 著者所属（和/英）	神戸大学(略称：神戸大) Kobe University(略称：Kobe Univ.)
第 2 著者氏名（和/英）	ドッサルスランフェルナンジュリアン / Rousslan Fernand Julien Dossa
第 2 著者所属（和/英）	神戸大学(略称：神戸大) Kobe University(略称：Kobe Univ.)
第 3 著者氏名（和/英）	野本洋一 / Hirokazu Nomoto
第 3 著者所属（和/英）	株式会社エクォス・リサーチ(略称：) EQUOS RESEARCH Co., Ltd.(略称：)
第 4 著者氏名（和/英）	松原崇 / Takashi Matsubara
第 4 著者所属（和/英）	神戸大学(略称：神戸大) Kobe University(略称：Kobe Univ.)
第 5 著者氏名（和/英）	上原邦昭 / Kuniaki Uehara
第 5 著者所属（和/英）	神戸大学(略称：神戸大) Kobe University(略称：Kobe Univ.)
発表年月日	2018-11-23
資料番号	CCS2018-41
巻番号（vol）	vol.118
号番号（no）	CCS-316
ページ範囲	pp.45-50(CCS),
ページ数	6
発行日	2018-11-15 (CCS)