講演抄録/キーワード |
講演名 |
2007-12-22 16:35
回避行動の再利用メカニズムを備えた強化学習のための関数近似器修正手法と多関節ロボットへの応用 ○山口明彦(奈良先端大/ATR)・杉本徳和(ATR)・川人光男(ATR/奈良先端大) NC2007-86 |
抄録 |
(和) |
強化学習などの学習手法をロボットの運動学習に適用する際に問題となる学習コスト(転倒によるダメージなど)を軽減する一手法として,我々はあるタスクの学習中に回避行動を分離して学習しこれをほかのタスクの学習で再利用する手法を強化学習の枠組で提案,4リンク程度の土台非固定型ロボットへの応用を行ってきた.本稿では分離学習における分離性能を向上させることを目的として基底関数を修正する手法を提案し,運動学習における有効性を示す.さらに回避行動を再利用することによって運動学習における転倒ダメージが軽減するかを検討する. |
(英) |
Applying a learning method, such as reinforcement learning, to learning motions of multi-link robots requires large cost, such as damage from falling down. To overcome this problem, we proposed a reusing mechanism for reinforcement learning where the avoidance actions, such as not to fall down, are learned separately from primary actions, then they are reused in learning new tasks. A method to apply it to learning whole-body motions of 4-link robot whose base is not fixed to a ground was also developed. In this paper, we propose a new method to modify basis functions of a function approximator of an action value function to improve the separative performance, and demonstrate the method works effectively in learning whole-body motions of a multi-link robot. Furthermore, we investigate a learning cost of damage from falling down in learning whole-body motions is reduced by reusing avoidance actions. |
キーワード |
(和) |
運動学習 / 強化学習 / 再利用 / 回避行動 / 跳躍 / サーブ / / |
(英) |
motion learning / reinforcement learning / reusing / avoidance actions / jumpping / serve / / |
文献情報 |
信学技報, vol. 107, no. 410, NC2007-86, pp. 87-92, 2007年12月. |
資料番号 |
NC2007-86 |
発行日 |
2007-12-15 (NC) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NC2007-86 |