講演抄録/キーワード |
講演名 |
2008-01-29 13:55
Safety Critical Systemに対する強化学習適用に関する検討 ○藤原真一・宮本俊幸・熊谷貞俊(阪大) CST2007-53 |
抄録 |
(和) |
マルチエージェント環境における,自律的な協調行動獲得の枠組みとして強化学習が注目されている.
強化学習は試行錯誤や知識利用による行動の結果得られる報酬を手掛かりとして環境に適応する学習制御の枠組みである.
本報告では,既に提案されているSafety Critical System(SCS)の障害抑制機構に対し,強化学習の適用可能性について検討する.
SCSでは,システムをいくつかのセクションに分割し,発生する障害をあるレベル以下に抑制することでシステムの動作を保証できると想定しており,本研究では,障害抑制機構の意思決定に強化学習を用いる.SCSは,各セクションで求められるレベルに応じて,障害の抑制に差をつけるという点でQuality of Serviceの概念と類似しており,既存のマルチエージェント強化学習のテストベッドとは異なるものである.
強化学習法として,元来シングルエージェント環境を対象に開発されたQ-Learningを用いたシミュレーションの結果,強化学習が適用可能であると判断したので報告する. |
(英) |
Reinforcement Learning have been attracting many researchers attention as a framework of autonomous cooperative behavior acquisition. In this framework, actor adapts to an environment with the help of a reward obtained as a result of the trial-and-error or application of self knowledge.
Now, we discuss a possibility to apply a multi-agent reinforcement learning to already proposed damage control mechanism of Safety Critical System(SCS). In the SCS, we suppose the total system is divided into some sections and performance is secured by controlling damages under a certain level. Then we employ a reinforcement learning method for a decision-making of damage control mechanism. SCS is different from existing other testbed of multi-agent reinforcement learning because it is similar to the concept of the Quality of Service in that we control damages differently according to each required damage level. According to a simulation the Q-learning is employed as a reinforcement learning method, we regarded the reinforcement learning is possible to apply to the SCS. |
キーワード |
(和) |
マルチエージェントシステム / 強化学習 / Q学習 / Safety Critical System / / / / |
(英) |
Multi-agent System / Reinforcement Learning / Q-learning / Safety Critical System / / / / |
文献情報 |
信学技報, vol. 107, 2008年1月. |
資料番号 |
|
発行日 |
2008-01-22 (CST) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
CST2007-53 |
研究会情報 |
研究会 |
MSS |
開催期間 |
2008-01-28 - 2008-01-29 |
開催地(和) |
徳島大学 |
開催地(英) |
The University of Tokushima |
テーマ(和) |
コンカレント工学一般、及び、CSTソリューションコンペティション2007発表会 |
テーマ(英) |
Concurrent Systems, CST Solution Competition 2007 |
講演論文情報の詳細 |
申込み研究会 |
MSS |
会議コード |
2008-01-CST |
本文の言語 |
日本語 |
タイトル(和) |
Safety Critical Systemに対する強化学習適用に関する検討 |
サブタイトル(和) |
|
タイトル(英) |
A Study on Applying Reinforcement Learning to a Safety Critical System |
サブタイトル(英) |
|
キーワード(1)(和/英) |
マルチエージェントシステム / Multi-agent System |
キーワード(2)(和/英) |
強化学習 / Reinforcement Learning |
キーワード(3)(和/英) |
Q学習 / Q-learning |
キーワード(4)(和/英) |
Safety Critical System / Safety Critical System |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
藤原 真一 / Shinichi Fujiwara / フジワラ シンイチ |
第1著者 所属(和/英) |
大阪大学 (略称: 阪大)
Osaka University (略称: Osaka Univ.) |
第2著者 氏名(和/英/ヨミ) |
宮本 俊幸 / Toshiyuki Miyamoto / ミヤモト トシユキ |
第2著者 所属(和/英) |
大阪大学 (略称: 阪大)
Osaka University (略称: Osaka Univ.) |
第3著者 氏名(和/英/ヨミ) |
熊谷 貞俊 / Sadatoshi Kumagai / クマガイ サダトシ |
第3著者 所属(和/英) |
大阪大学 (略称: 阪大)
Osaka University (略称: Osaka Univ.) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2008-01-29 13:55:00 |
発表時間 |
25分 |
申込先研究会 |
MSS |
資料番号 |
CST2007-53 |
巻番号(vol) |
vol.107 |
号番号(no) |
no.472 |
ページ範囲 |
pp.41-46 |
ページ数 |
6 |
発行日 |
2008-01-22 (CST) |