強化学習による自動車運転技能の獲得

講演名	1997/3/18 強化学習による自動車運転技能の獲得小池康晴, 銅谷賢治,
PDFダウンロードページ	PDFダウンロードページへ
抄録(和)	人間が自動車の運転操作を学習により獲得するモデルを強化学習を用いて作成した.連続時間版のTD学習を用いることで, 自動車のダイナミクスのような問題にも強化学習が有効であることがわかった. 自動車の順モデルを用いて予測した位置と姿勢を使って,TD学習のための報酬や,制御入力を計算した.学習後のモデルは,未学習データに関してもステアリング操作を計算できるようになった.さらに,ステアリング操作だけでなく速度の制御も行なえることも確認した.
抄録(英)	A reinforcement learning model of automobile drining is proposed. The continuous-time formula of temporal differece(TD)learning is applied to controlling a vehicle dynamics. The position and the rotation angle which are calculated by a forward model of the vechile are used as the inputs of the value function. The acquired driver model can drive the road which are not used for training.
キーワード(和)	自動車 / 強化学習 / ドライバーモデル / ステアリング制御
キーワード(英)	vehicle / reinforcement learning / driver model / stering control
資料番号	NC96-169
発行日

講演論文情報詳細
申込み研究会	Neurocomputing (NC)
本文の言語	JPN
タイトル（和）	強化学習による自動車運転技能の獲得
サブタイトル（和）
タイトル（英）	Acquisition of driving skill by reinforcement learning
サブタイトル（和）
キーワード(1)（和/英）	自動車 / vehicle
キーワード(2)（和/英）	強化学習 / reinforcement learning
キーワード(3)（和/英）	ドライバーモデル / driver model
キーワード(4)（和/英）	ステアリング制御 / stering control
第 1 著者氏名（和/英）	小池康晴 / Yasuharu KOIKE
第 1 著者所属（和/英）	トヨタ自動車 TOYOTA MOTOR CORPORATION
第 2 著者氏名（和/英）	銅谷賢治 / Kenji DOYA
第 2 著者所属（和/英）	科学技術振興事業団 Japan Science and Technology Corporation
発表年月日	1997/3/18
資料番号	NC96-169
巻番号（vol）	vol.96
号番号（no）	584
ページ範囲	pp.-
ページ数	8
発行日