講演名 2002/3/11
強化学習を用いた移動ロボットの行動制御
山崎 善正, 石川 眞澄,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 移動ロボットの重要な機能の一つにナビゲーション機能がある。さらに、ナビゲーションの中で重要な機能のひとつにロボットがゴールに到達するためにどのような行動をしたらよいかを決めるための行動制御がある。本研究では移動ロボット自身が自律的に環境との相互作用を通して学習しナビゲーションに必要な機能を獲得することを目的とする。その際、環境との相互作用を通して学習をおこなう強化学習に注目した。さらに、実際に存在する移動ロボット(LABO3)をモデルにした移動ロボットシミュレータを用いて、ロボット自身が自律的な学習により最適経路を学習することに成功した。
抄録(英) A navigation task for a mobile robot includes path planning to the goal while avoiding obstacles. The present paper aims at training a mobile robot through interation with the envirionment: movement of a mobile robot and reward from the envirionment as a result of movement. This interaction fits well with reinforcement learning. Among various reinforcement learning algorithms Q-learning is adopted here because motion control as well as current position play an important role. A computer simulation demonstrates that Q-learning succeeds in obtaining optimal path to the goal without collision.
キーワード(和) 強化学習 / 移動ロボット / Q学習 / 最適経路
キーワード(英) reinforcement learning / mobile robots / Q-learning / optimal path
資料番号 NC2001-143
発行日

研究会情報
研究会 NC
開催期間 2002/3/11(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Neurocomputing (NC)
本文の言語 JPN
タイトル(和) 強化学習を用いた移動ロボットの行動制御
サブタイトル(和)
タイトル(英) Motion Control of a Mobile Robot by Reinforcement Learning
サブタイトル(和)
キーワード(1)(和/英) 強化学習 / reinforcement learning
キーワード(2)(和/英) 移動ロボット / mobile robots
キーワード(3)(和/英) Q学習 / Q-learning
キーワード(4)(和/英) 最適経路 / optimal path
第 1 著者 氏名(和/英) 山崎 善正 / Yoshimasa YAMASAKI
第 1 著者 所属(和/英) 九州工業大学大学院 情報工学研究科
Graduate School of Computer Science and Systems Engineerring Kyushu Institute of Technology
第 2 著者 氏名(和/英) 石川 眞澄 / Masumi ISHIKAWA
第 2 著者 所属(和/英) 九州工業大学大学院 生命体工学研究科
Graduate School of Life Science and Systems Engineerring Kyushu Institute of Technology
発表年月日 2002/3/11
資料番号 NC2001-143
巻番号(vol) vol.101
号番号(no) 735
ページ範囲 pp.-
ページ数 8
発行日