講演名 2002/12/6
複数制御器の切り換えを行う強化学習アーキテクチャによるドライバモデル
折田 敦, 小池 康晴,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本研究では,ある制御対象において連続値出力を行う複数の制御器が存在するときに,それらの切り換えと制御出力を学習する強化学習アーキテクチャを提案する.制御器切り換えの学習にはQ-learningを用い,制御出力はActor-Criticで獲得する.そして,このアーキテクチャを自動車の速度・車間距離制御タスクに適用し,シミュレーション実験を行った結果について述べる.実験では車両二台による追従走行を想定する.このタスクにはアクセルペダルとブレーキペダルの選択及びペダル踏み込み量を決定するという問題が含まれている.実験の結果より,前方を走行する先行車の速度変化に応じて,学習を行う追従車はペダル選択と操作量を決定し,追突することなく走行できることを確認した.また,この制御方式では複数強化学習器の切り換えを実現したが,この切り換えの効果を単一のActor-Criticモデルと比較し考察する.さらに,提案アーキテクチャで獲得した行動の運転特性が人間による運転と類似していることを示す.
抄録(英) In this paper, we propose a reinforcement learning architecture which switches multiple controllers and outputs continuous control commands. We used Q-learning for switching the controllers and Actor-Critic for controlling commands. This architecture was applied to a car following task in which speed and headway distance were controlled. The task includes the problem that which pedal and how much the following car step on. From simulation results, we confirmed that it could aquire the control method to achive the task. And we compared our model with one Actor-Critic model about the ability of the car following task. We also showed that the control method had the similar driving characteristic to drivers' one.
キーワード(和) 強化学習 / 速度・車間距離制御 / ドライバモデル
キーワード(英) Reinforcement learning / Speed and headway distance control / Driver model
資料番号 NC2002-100
発行日

研究会情報
研究会 NC
開催期間 2002/12/6(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Neurocomputing (NC)
本文の言語 JPN
タイトル(和) 複数制御器の切り換えを行う強化学習アーキテクチャによるドライバモデル
サブタイトル(和)
タイトル(英) A Driver Model based on Reinforcement Learning Switching Multiple Controllers
サブタイトル(和)
キーワード(1)(和/英) 強化学習 / Reinforcement learning
キーワード(2)(和/英) 速度・車間距離制御 / Speed and headway distance control
キーワード(3)(和/英) ドライバモデル / Driver model
第 1 著者 氏名(和/英) 折田 敦 / Atsushi ORITA
第 1 著者 所属(和/英) 東京工業大学大学院総合理工学研究科知能システム科学
Department of Computational Intelligence and Systems Science, Interdisciplinary Graduate School of Science and Engineering, Tokyo Institute of Technology
第 2 著者 氏名(和/英) 小池 康晴 / Yasuharu KOIKE
第 2 著者 所属(和/英) 科学技術振興事業団さきがけ研究21:東京工業大学精密工学研究所
JST PRESTO:Precision and Intelligence Laboratory, Tokyo Institute of Technology
発表年月日 2002/12/6
資料番号 NC2002-100
巻番号(vol) vol.102
号番号(no) 508
ページ範囲 pp.-
ページ数 6
発行日