講演名 1997/3/18
強化学習による自動車運転技能の獲得
小池 康晴, 銅谷 賢治,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 人間が自動車の運転操作を学習により獲得するモデルを強化学習を用いて作成した.連続時間版のTD学習を用いることで, 自動車のダイナミクスのような問題にも強化学習が有効であることがわかった. 自動車の順モデルを用いて予測した位置と姿勢を使って,TD学習のための報酬や,制御入力を計算した.学習後のモデルは,未学習データに関してもステアリング操作を計算できるようになった.さらに,ステアリング操作だけでなく速度の制御も行なえることも確認した.
抄録(英) A reinforcement learning model of automobile drining is proposed. The continuous-time formula of temporal differece(TD)learning is applied to controlling a vehicle dynamics. The position and the rotation angle which are calculated by a forward model of the vechile are used as the inputs of the value function. The acquired driver model can drive the road which are not used for training.
キーワード(和) 自動車 / 強化学習 / ドライバーモデル / ステアリング制御
キーワード(英) vehicle / reinforcement learning / driver model / stering control
資料番号 NC96-169
発行日

研究会情報
研究会 NC
開催期間 1997/3/18(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Neurocomputing (NC)
本文の言語 JPN
タイトル(和) 強化学習による自動車運転技能の獲得
サブタイトル(和)
タイトル(英) Acquisition of driving skill by reinforcement learning
サブタイトル(和)
キーワード(1)(和/英) 自動車 / vehicle
キーワード(2)(和/英) 強化学習 / reinforcement learning
キーワード(3)(和/英) ドライバーモデル / driver model
キーワード(4)(和/英) ステアリング制御 / stering control
第 1 著者 氏名(和/英) 小池 康晴 / Yasuharu KOIKE
第 1 著者 所属(和/英) トヨタ自動車
TOYOTA MOTOR CORPORATION
第 2 著者 氏名(和/英) 銅谷 賢治 / Kenji DOYA
第 2 著者 所属(和/英) 科学技術振興事業団
Japan Science and Technology Corporation
発表年月日 1997/3/18
資料番号 NC96-169
巻番号(vol) vol.96
号番号(no) 584
ページ範囲 pp.-
ページ数 8
発行日