電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
技報オンライン
‥‥ (ESS/通ソ/エレソ/ISS)
技報アーカイブ
‥‥ (エレソ/通ソ)
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2018-11-23 10:50
A Human-Like Agent Based on a Hybrid of Reinforcement and Imitation Learning
Xinyu LianRousslan Fernand Julien DossaKobe Univ.)・Hirokazu NomotoTakashi MatsubaraKuniaki UeharaKobe Univ.
技報オンラインサービス実施中
抄録 (和) (まだ登録されていません) 
(英) Reinforcement learning (RL) makes it possible to build an efficient agent that handles tasks in complex and uncertain environments by maximizing future reward. However, for applications in some areas like game AI and autonomous driving, efficiency only cannot satisfy the practical use, and a human-like agent is preferable. On the other hand, in imitation learning (IL) tasks, which trains the agent to mimic actions of expert behavior provided as training data and thereby learns relatively complex tasks while achieving human-like behavior. Unfortunately, the performance of such an agent is generally limited by the expert behavior. Thus, with the aim of training an agent which achieves high performance while retaining a human-like behavior, we propose a method for mixing RL and IL, applicable to both discrete and continuous problems. We used state-of-the-art RL and IL algorithms and trained their respective models independently, before mixing them into the proposed hybrid model.
キーワード (和) / / / / / / /  
(英) Human-Like / Hybrid Model / Reinforcement Learning / Imitation Learning / Game AI / Autonomous Driving / /  
文献情報 信学技報, vol. 118, no. 316, CCS2018-41, pp. 45-50, 2018年11月.
資料番号 CCS2018-41 
発行日 2018-11-15 (CCS) 
ISSN Print edition: ISSN 0913-5685  Online edition: ISSN 2432-6380

研究会情報
研究会 CCS  
開催期間 2018-11-22 - 2018-11-23 
開催地(和) 神戸大学 
開催地(英) Kobe Univ. 
テーマ(和) 相互作用と情報伝達・情報処理,一般 
テーマ(英) Interaction and Communication, etc. 
講演論文情報の詳細
申込み研究会 CCS 
会議コード 2018-11-CCS 
本文の言語 英語 
タイトル(和)  
サブタイトル(和)  
タイトル(英) A Human-Like Agent Based on a Hybrid of Reinforcement and Imitation Learning 
サブタイトル(英)  
キーワード(1)(和/英) / Human-Like  
キーワード(2)(和/英) / Hybrid Model  
キーワード(3)(和/英) / Reinforcement Learning  
キーワード(4)(和/英) / Imitation Learning  
キーワード(5)(和/英) / Game AI  
キーワード(6)(和/英) / Autonomous Driving  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 連 欣瑜 / Xinyu Lian / レン シンユ
第1著者 所属(和/英) 神戸大学 (略称: 神戸大)
Kobe University (略称: Kobe Univ.)
第2著者 氏名(和/英/ヨミ) ドッサ ルスラン フェルナン ジュリアン / Rousslan Fernand Julien Dossa / ドッサ ルスラン フェルナン ジュリアン
第2著者 所属(和/英) 神戸大学 (略称: 神戸大)
Kobe University (略称: Kobe Univ.)
第3著者 氏名(和/英/ヨミ) 野本 洋一 / Hirokazu Nomoto / ノモト ヒロカズ
第3著者 所属(和/英) 株式会社エクォス・リサーチ (略称: *)
EQUOS RESEARCH Co., Ltd. (略称: *)
第4著者 氏名(和/英/ヨミ) 松原 崇 / Takashi Matsubara / マツバラ タカシ
第4著者 所属(和/英) 神戸大学 (略称: 神戸大)
Kobe University (略称: Kobe Univ.)
第5著者 氏名(和/英/ヨミ) 上原 邦昭 / Kuniaki Uehara / ウエハラ クニアキ
第5著者 所属(和/英) 神戸大学 (略称: 神戸大)
Kobe University (略称: Kobe Univ.)
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者
発表日時 2018-11-23 10:50:00 
発表時間 25 
申込先研究会 CCS 
資料番号 IEICE-CCS2018-41 
巻番号(vol) IEICE-118 
号番号(no) no.316 
ページ範囲 pp.45-50 
ページ数 IEICE-6 
発行日 IEICE-CCS-2018-11-15 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会