講演名 2000/5/18
強化学習による自律移動ロボットのシュート行動獲得
秋元 崇, 宮内 新, 石川 知雄,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿では実環境における学習時間を考慮したQ-learningについて検討を行った.Q-learningではサブタクス毎にQ-tableを用意することが行われているが, サブタスク数が増加すると全体の学習時間に対するサブタクス当たりの学習時間の割合が低下し, 全てのサブタクスの学習が終了するにはかなりの時間がかかる.そこで, 2つの状態空間が異なるサブタスクを同一のタスクに帰着させ, 単一のQ-tableのみを用いて学習する手法を提案する.実ロボットによるシュート行動獲得に本手法を適用し, 一つの学習結果を異なるサブタスクにおいて再利用することで学習の効率化を計り, 学習時間を低減させたタスク学習を可能とした。
抄録(英) In this article, we examine Q-learning which considered learning time. In Q-learning method, each subtask requires its own Q-table. When the number of subtasks increases, the ratio between the learning time at each subtask to total learning time decreases, so we need much time to finish learning of all subtasks. So, we propose the learning method to handle two subtasks as one and use our Q-table. We applied our method into shoot behavior acquisition of soccer robot. As the result of experiments, indicates the effectiveness of our method(using the same learning result in different two subtasks).
キーワード(和) 実ロボット / 強化学習 / オンライン学習 / サッカーロボット
キーワード(英) real robot / reinforcement learning / on-line learning / soccer robot
資料番号 AI2000-1
発行日

研究会情報
研究会 AI
開催期間 2000/5/18(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Artificial Intelligence and Knowledge-Based Processing (AI)
本文の言語 JPN
タイトル(和) 強化学習による自律移動ロボットのシュート行動獲得
サブタイトル(和)
タイトル(英) Shoot Behavior Acquisition of Autonomous Robot Using Reinforcement Learning
サブタイトル(和)
キーワード(1)(和/英) 実ロボット / real robot
キーワード(2)(和/英) 強化学習 / reinforcement learning
キーワード(3)(和/英) オンライン学習 / on-line learning
キーワード(4)(和/英) サッカーロボット / soccer robot
第 1 著者 氏名(和/英) 秋元 崇 / Akimoto Takashi
第 1 著者 所属(和/英) 武蔵工業大学大学院電気工学専攻
Graduate School of Electrical Engineering Musashi Institute of Technology
第 2 著者 氏名(和/英) 宮内 新 / Miyauchi Arata
第 2 著者 所属(和/英) 武蔵工業大学大学院電気工学専攻
Graduate School of Electrical Engineering Musashi Institute of Technology
第 3 著者 氏名(和/英) 石川 知雄 / Ishikawa Tomoo
第 3 著者 所属(和/英) 武蔵工業大学大学院電気工学専攻
Graduate School of Electrical Engineering Musashi Institute of Technology
発表年月日 2000/5/18
資料番号 AI2000-1
巻番号(vol) vol.100
号番号(no) 88
ページ範囲 pp.-
ページ数 6
発行日