講演名 2009-05-25
感覚情報の能動的低次元化による強化学習(機械学習によるバイオデータマインニング,一般)
小林 幹浩, 内部 英治, 銅谷 賢治,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 移動ロボットの視覚誘導タスクはロボット分野における基礎タスクの1つである.視覚センサを用いたロボットにおける視覚情報処理の過程とシステムダイナミクスを結合する枠組みに視覚サーボがあるが,画像特徴量誤差を小さくするよう関節角を制御することを目的としているので移動ロボットに適用してもロボットの移動は困難である.本報告では,移動に強化学習を用いた視覚サーボによる視覚誘導タスクの実現方法を提案する.提案システムは視覚サーボ部と強化学習部で構成され,カメラヘッドを視覚サーボ部により制御し,移動に用いる脚周りの関節を強化学習部により制御する.また,強化学習を用いるには状態空間や報酬を設定する必要があり,視覚サーボの情報を用いることで状態空間の大幅な削減が出来るだけでなく,報酬の取得も可能となる.これは視覚サーボ実行後の関節角度が対象物とロボットの相対位置を表現すると考えられるためである.提案手法を4脚ロボットAIBOに適用し,簡単な行動学習実験により有効性を示す.
抄録(英) The goal of this research is to reduce the dimension of the state spaces in the framework of reinforcement learning using visual servoing. The adaptive visual servoing minimizes the distance between the current and desired image measurements by controlling joint angles of the camera-head mounted on the robot. The final joint angles of camera-head are regarded as the position of the robot in the environment. Therefore, the state space can be constructed from the converged joint angles of the camera head. On the other hand, the role of reinforcement learning is to drive the robot to the target object in the environment. Experimental results show that the efficacy of the proposed method with real robot.
キーワード(和) 強化学習 / 視覚サーボ / 自律型エージェント / 内部表現 / 低次元化
キーワード(英) reinforcement learning / visual servoing / autonomous agent / internal representation / low-dimensional
資料番号 NC2009-4
発行日

研究会情報
研究会 NC
開催期間 2009/5/18(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Neurocomputing (NC)
本文の言語 JPN
タイトル(和) 感覚情報の能動的低次元化による強化学習(機械学習によるバイオデータマインニング,一般)
サブタイトル(和)
タイトル(英) Reinforcement learning through the active low-dimensional sensory information
サブタイトル(和)
キーワード(1)(和/英) 強化学習 / reinforcement learning
キーワード(2)(和/英) 視覚サーボ / visual servoing
キーワード(3)(和/英) 自律型エージェント / autonomous agent
キーワード(4)(和/英) 内部表現 / internal representation
キーワード(5)(和/英) 低次元化 / low-dimensional
第 1 著者 氏名(和/英) 小林 幹浩 / Mikihiro KOBAYASHI
第 1 著者 所属(和/英) 奈良先端科学技術大学院大学
Nara Institute of Science and Technology
第 2 著者 氏名(和/英) 内部 英治 / Eiji UCHIBE
第 2 著者 所属(和/英) 独立行政法人沖縄科学技術研究基盤整備機構沖縄大学院大学先行的研究事業
Okinawa Institute of Science and Technology Promotion Corporation
第 3 著者 氏名(和/英) 銅谷 賢治 / Kenji DOYA
第 3 著者 所属(和/英) 独立行政法人沖縄科学技術研究基盤整備機構沖縄大学院大学先行的研究事業
Okinawa Institute of Science and Technology Promotion Corporation
発表年月日 2009-05-25
資料番号 NC2009-4
巻番号(vol) vol.109
号番号(no) 53
ページ範囲 pp.-
ページ数 6
発行日