お知らせ 6月18日(火)18:00~23:00 システムメンテナンスのため学会の全てのサーバが停止いたします.
くわしくはこちらをごらんください.
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
技報オンライン
‥‥ (ESS/通ソ/エレソ/ISS)
技報アーカイブ
‥‥ (エレソ/通ソ)
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2013-10-17 10:30
オープンソースソフトウェアを用いた強化学習アルゴリズムの実現
内部英治銅谷賢治沖縄科技大
技報オンラインサービス実施中
抄録 (和) 強化学習は自律的な行動学習手法として研究され,これまでに非常に多くのアルゴリズムが提案され,近年はヒューマノイドロボットのような高自由度なシステムにも適用可能なものが増えてきた.しかしながら,これらのアルゴリズムを強化学習の非専門家がすぐに利用できるかというとそうではない.オープンソースソフトウェア(OSS)として公開されているものも増えているが,周知不足のこともあって有効活用されているとは言い難い状況が続いている.本稿ではRL-Glue, PyBrainといった既存の強化学習に関連するOSSについて概説し,それらの利点・欠点をロボット制御の観点から述べる.次に我々が開発している脚式ロボットやスマートフォンロボットにRL-Glueを使った強化学習アルゴリズムを実装する取り組みについて述べる. 
(英) Reinforcement learning has been studied as an autonomous learning framework for robots. Several learning algorithms have been proposed and some studies have been applied to the robot control with many degrees of freedoms such as humanoid robots successfully. However, it is difficult for researchers/developers who are not familiar with reinforcement learning to use those algorithms. Some of them are distributed as free, open source software (OSS), but they are not fully exploited because of several problems. This paper overviews existing open source software in the field of reinforcement learning such as RL-Glue, PyBrain, and so on, and we discuss the advantages and disadvantages from a viewpoint of robot control. Next, we show how we apply open source software such as RL-Glue introduced here to our robot such as legged robots and smartphone robots in order to implement the specific reinforcement learning algorithm.
キーワード (和) 強化学習 / オープンソースソフトウェア / RL-Glue / PyBrain / / / /  
(英) reinforcement learning / open source software / RL-Glue / PyBrain / / / /  
文献情報 信学技報, vol. 113, no. 248, CNR2013-9, pp. 1-6, 2013年10月.
資料番号 CNR2013-9 
発行日 2013-10-10 (CNR) 
ISSN Print edition: ISSN 0913-5685  Online edition: ISSN 2432-6380

研究会情報
研究会 CNR  
開催期間 2013-10-17 - 2013-10-18 
開催地(和) グランフロント大阪 
開催地(英) Grand Front Osaka 
テーマ(和) オープンソースソフト/ハードとサービスを繋ぐクラウドネットワークロボティクス 
テーマ(英) Cloud Networked Robotics based on Open Source Software and Hardware 
講演論文情報の詳細
申込み研究会 CNR 
会議コード 2013-10-CNR 
本文の言語 日本語 
タイトル(和) オープンソースソフトウェアを用いた強化学習アルゴリズムの実現 
サブタイトル(和)  
タイトル(英) Implementation of reinforcement learning using open source software 
サブタイトル(英)  
キーワード(1)(和/英) 強化学習 / reinforcement learning  
キーワード(2)(和/英) オープンソースソフトウェア / open source software  
キーワード(3)(和/英) RL-Glue / RL-Glue  
キーワード(4)(和/英) PyBrain / PyBrain  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 内部 英治 / Eiji Uchibe / ウチベ エイジ
第1著者 所属(和/英) 沖縄科学技術大学院大学 (略称: 沖縄科技大)
Okinawa Institute of Science and Technology (略称: OIST)
第2著者 氏名(和/英/ヨミ) 銅谷 賢治 / Kenji Doya / ドウヤ ケンジ
第2著者 所属(和/英) 沖縄科学技術大学院大学 (略称: 沖縄科技大)
Okinawa Institute of Science and Technology (略称: OIST)
第3著者 氏名(和/英/ヨミ) / /
第3著者 所属(和/英) (略称: )
(略称: )
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者
発表日時 2013-10-17 10:30:00 
発表時間 30 
申込先研究会 CNR 
資料番号 IEICE-CNR2013-9 
巻番号(vol) IEICE-113 
号番号(no) no.248 
ページ範囲 pp.1-6 
ページ数 IEICE-6 
発行日 IEICE-CNR-2013-10-10 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会