お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2011-03-07 16:25
Fusing Learning Strategies to Learn Various Tasks with Single Configuration
Akihiko YamaguchiJun TakamatsuTsukasa OgasawaraNAISTNC2010-154
抄録 (和) 本論文では,強化学習の枠組で学習戦略を融合する手法を提案する.一般に,各タスクそれぞれに対して適切な学習戦略を選択する必要がある.これに対し,提案手法では学習戦略を融合することにより,この選択を自動化する.本論文で融合される学習戦略は,転移学習,階層型強化学習,モデルベース強化学習を含む.提案手法は,幅広い応用範囲を持つ.提案手法を匍匐などの運動学習タスクに適用する場合,動作のパフォーマンスは単一の学習戦略を用いる場合と比べて改善される.提案手法では,匍匐や旋回などの既に学習された動作を階層的に統合し,ナビゲーションタスクに適用することも可能である.本論文では,ヒューマノイドロボットの迷路タスクへ適用した結果を示す.このタスクでは,ゴールまでのパスだけでなく,ほふくや旋回も学習される. 
(英) This paper proposes a method to fuse learning strategies (LSs) in reinforcement learning framework. Generally, we need to choose a suitable LS for each task respectively. In contrast, the proposed method automates this selection by fusing LSs. The LSs fused in this paper includes a transfer learning, a hierarchical RL, and a model based RL. The proposed method has a wide applicability. When the method is applied to a motion learning task, such as a crawling task, the performance of motion may be improved compared to an agent with a single LS. The method also can be applied to a navigation task by hierarchically combining already learned motions, such as a crawling and a turning. This paper demonstrates a maze task of a humanoid robot where the robot learns not only a path to goal, but also a crawling and a turning motions.
キーワード (和) 学習システム / 強化学習 / モジュール化 / 運動学習 / ヒューマノイドロボット / / /  
(英) Learning System / Reinforcement Learning / Modularization / Motion Learning / Humanoid Robot / / /  
文献情報 信学技報, vol. 110, no. 461, NC2010-154, pp. 159-164, 2011年3月.
資料番号 NC2010-154 
発行日 2011-02-28 (NC) 
ISSN Print edition: ISSN 0913-5685    Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード NC2010-154

研究会情報
研究会 NC MBE  
開催期間 2011-03-07 - 2011-03-09 
開催地(和) 玉川大学 
開催地(英) Tamagawa University 
テーマ(和) 一般 
テーマ(英)  
講演論文情報の詳細
申込み研究会 NC 
会議コード 2011-03-NC-MBE 
本文の言語 英語 
タイトル(和)  
サブタイトル(和)  
タイトル(英) Fusing Learning Strategies to Learn Various Tasks with Single Configuration 
サブタイトル(英)  
キーワード(1)(和/英) 学習システム / Learning System  
キーワード(2)(和/英) 強化学習 / Reinforcement Learning  
キーワード(3)(和/英) モジュール化 / Modularization  
キーワード(4)(和/英) 運動学習 / Motion Learning  
キーワード(5)(和/英) ヒューマノイドロボット / Humanoid Robot  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 山口 明彦 / Akihiko Yamaguchi / ヤマグチ アキヒコ
第1著者 所属(和/英) 奈良先端科学技術大学院大学 (略称: 奈良先端大)
Nara Institute of Science and Technology (略称: NAIST)
第2著者 氏名(和/英/ヨミ) 高松 淳 / Jun Takamatsu / タカマツ ジュン
第2著者 所属(和/英) 奈良先端科学技術大学院大学 (略称: 奈良先端大)
Nara Institute of Science and Technology (略称: NAIST)
第3著者 氏名(和/英/ヨミ) 小笠原 司 / Tsukasa Ogasawara / オガサワラ ツカサ
第3著者 所属(和/英) 奈良先端科学技術大学院大学 (略称: 奈良先端大)
Nara Institute of Science and Technology (略称: NAIST)
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2011-03-07 16:25:00 
発表時間 25分 
申込先研究会 NC 
資料番号 NC2010-154 
巻番号(vol) vol.110 
号番号(no) no.461 
ページ範囲 pp.159-164 
ページ数
発行日 2011-02-28 (NC) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会