講演名 | 1997/3/18 強化学習による自動車運転技能の獲得 小池 康晴, 銅谷 賢治, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 人間が自動車の運転操作を学習により獲得するモデルを強化学習を用いて作成した.連続時間版のTD学習を用いることで, 自動車のダイナミクスのような問題にも強化学習が有効であることがわかった. 自動車の順モデルを用いて予測した位置と姿勢を使って,TD学習のための報酬や,制御入力を計算した.学習後のモデルは,未学習データに関してもステアリング操作を計算できるようになった.さらに,ステアリング操作だけでなく速度の制御も行なえることも確認した. |
抄録(英) | A reinforcement learning model of automobile drining is proposed. The continuous-time formula of temporal differece(TD)learning is applied to controlling a vehicle dynamics. The position and the rotation angle which are calculated by a forward model of the vechile are used as the inputs of the value function. The acquired driver model can drive the road which are not used for training. |
キーワード(和) | 自動車 / 強化学習 / ドライバーモデル / ステアリング制御 |
キーワード(英) | vehicle / reinforcement learning / driver model / stering control |
資料番号 | NC96-169 |
発行日 |
研究会情報 | |
研究会 | NC |
---|---|
開催期間 | 1997/3/18(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Neurocomputing (NC) |
---|---|
本文の言語 | JPN |
タイトル(和) | 強化学習による自動車運転技能の獲得 |
サブタイトル(和) | |
タイトル(英) | Acquisition of driving skill by reinforcement learning |
サブタイトル(和) | |
キーワード(1)(和/英) | 自動車 / vehicle |
キーワード(2)(和/英) | 強化学習 / reinforcement learning |
キーワード(3)(和/英) | ドライバーモデル / driver model |
キーワード(4)(和/英) | ステアリング制御 / stering control |
第 1 著者 氏名(和/英) | 小池 康晴 / Yasuharu KOIKE |
第 1 著者 所属(和/英) | トヨタ自動車 TOYOTA MOTOR CORPORATION |
第 2 著者 氏名(和/英) | 銅谷 賢治 / Kenji DOYA |
第 2 著者 所属(和/英) | 科学技術振興事業団 Japan Science and Technology Corporation |
発表年月日 | 1997/3/18 |
資料番号 | NC96-169 |
巻番号(vol) | vol.96 |
号番号(no) | 584 |
ページ範囲 | pp.- |
ページ数 | 8 |
発行日 |