講演抄録/キーワード |
講演名 |
2009-03-11 16:35
方策勾配法によるCPGに基づいたエネルギー効率の良い二足歩行の学習 ○東 良行・柴田智広(奈良先端大) NC2008-125 |
抄録 |
(和) |
多リンク,多関節を有するロボットを少ない自由度で簡便に制御するために,しばしばCPG(Central Pattern Generator)が用いられ,二足歩行ロボットに対しても応用がなされてきた.また,CPG の内部パラメータを決定するために,しばしば強化学習が適用されてきた.しかし,CPG に基づいた二足歩行ロボットの制御について,これまでエネルギー効率に関する定量的な検討は特に行われてこなかった.そこで本研究では,Cmt(Cost of mechanical
transport)と呼ばれる指標を報酬関数とし,強化学習の一種である方策勾配法を適用することにより,CPG に基づ
いたエネルギー効率の良い二足歩行の学習が可能であることを,シミュレーション実験によって示す. |
(英) |
Central Pattern Generator (CPG) has been applied to controlling multi-link/joint robots including
bipedal robots because it enables convenient controls with a fewer number of degree of freedom. Reinforcement
learning methods have often been applied to determine internal parameter values of the CPG. Investigation of
energy efficiency of the controller, however, has not been done for robots controlled by the CPG. By simulation,
we demonstrate that energy-efficient bipedal walking controller can be acquired by policy gradient learning whose
reward function uses an index called Cost of mechanical transport Cmt. |
キーワード |
(和) |
CPG / エネルギー効率 / 強化学習 / 方策勾配法 / / / / |
(英) |
CPG / energy-efficiency / reinforcement learning / policy gradient / / / / |
文献情報 |
信学技報, vol. 108, no. 480, NC2008-125, pp. 129-134, 2009年3月. |
資料番号 |
NC2008-125 |
発行日 |
2009-03-04 (NC) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NC2008-125 |