講演抄録/キーワード |
講演名 |
2011-03-07 16:50
複合行動型強化学習 ○中間隼人・山田 訓(岡山理科大) NC2010-155 |
抄録 |
(和) |
複合行動は,中間的な目的を達成するために必要になる複数のプリミティブな行動と,目的が達成された場合の終了条件で構成される.全てを一から学習するのではなく,状況に合わせて必要な行動群を選択することを学習するので学習時間を短縮できる.本研究では,ターゲットを探査する制御課題に複合行動型強化学習を適用した.複合行動型強化学習の性能を評価するため,複合行動を用いてHand--coding制御を作成した.制御学習のシミュレーションを行い,学習結果と比較し有効性を検証した.その結果,学習したシステムはHand--coding制御より優れた性能を示した. |
(英) |
The multiple action consists of a group of primitive actions and the termination conditions. In this study, the RL with multiple actions was applied to the control task where the ``AND" condition of two types of sensors must be discriminated, and to the control task where target must be transported to the destination. These tasks are complicated control tasks which require two or more types of sensor information. To evaluate the learning performance of the RL with multiple actions, it was compared with the hand-coded controls using the multiple actions. As a result, the RL with multiple actions learned the controls which were more excellent than the hand-coded controls. |
キーワード |
(和) |
強化学習 / 学習制御 / 複合行動 / / / / / |
(英) |
Reinforcement learning / Learning control / Multiple actions / / / / / |
文献情報 |
信学技報, vol. 110, no. 461, NC2010-155, pp. 165-170, 2011年3月. |
資料番号 |
NC2010-155 |
発行日 |
2011-02-28 (NC) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NC2010-155 |