お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2008-01-29 13:55
Safety Critical Systemに対する強化学習適用に関する検討
藤原真一宮本俊幸熊谷貞俊阪大CST2007-53
抄録 (和) マルチエージェント環境における,自律的な協調行動獲得の枠組みとして強化学習が注目されている.
強化学習は試行錯誤や知識利用による行動の結果得られる報酬を手掛かりとして環境に適応する学習制御の枠組みである.
本報告では,既に提案されているSafety Critical System(SCS)の障害抑制機構に対し,強化学習の適用可能性について検討する.
SCSでは,システムをいくつかのセクションに分割し,発生する障害をあるレベル以下に抑制することでシステムの動作を保証できると想定しており,本研究では,障害抑制機構の意思決定に強化学習を用いる.SCSは,各セクションで求められるレベルに応じて,障害の抑制に差をつけるという点でQuality of Serviceの概念と類似しており,既存のマルチエージェント強化学習のテストベッドとは異なるものである.
強化学習法として,元来シングルエージェント環境を対象に開発されたQ-Learningを用いたシミュレーションの結果,強化学習が適用可能であると判断したので報告する. 
(英) Reinforcement Learning have been attracting many researchers attention as a framework of autonomous cooperative behavior acquisition. In this framework, actor adapts to an environment with the help of a reward obtained as a result of the trial-and-error or application of self knowledge.
Now, we discuss a possibility to apply a multi-agent reinforcement learning to already proposed damage control mechanism of Safety Critical System(SCS). In the SCS, we suppose the total system is divided into some sections and performance is secured by controlling damages under a certain level. Then we employ a reinforcement learning method for a decision-making of damage control mechanism. SCS is different from existing other testbed of multi-agent reinforcement learning because it is similar to the concept of the Quality of Service in that we control damages differently according to each required damage level. According to a simulation the Q-learning is employed as a reinforcement learning method, we regarded the reinforcement learning is possible to apply to the SCS.
キーワード (和) マルチエージェントシステム / 強化学習 / Q学習 / Safety Critical System / / / /  
(英) Multi-agent System / Reinforcement Learning / Q-learning / Safety Critical System / / / /  
文献情報 信学技報, vol. 107, 2008年1月.
資料番号  
発行日 2008-01-22 (CST) 
ISSN Print edition: ISSN 0913-5685    Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード CST2007-53

研究会情報
研究会 MSS  
開催期間 2008-01-28 - 2008-01-29 
開催地(和) 徳島大学 
開催地(英) The University of Tokushima 
テーマ(和) コンカレント工学一般、及び、CSTソリューションコンペティション2007発表会 
テーマ(英) Concurrent Systems, CST Solution Competition 2007 
講演論文情報の詳細
申込み研究会 MSS 
会議コード 2008-01-CST 
本文の言語 日本語 
タイトル(和) Safety Critical Systemに対する強化学習適用に関する検討 
サブタイトル(和)  
タイトル(英) A Study on Applying Reinforcement Learning to a Safety Critical System 
サブタイトル(英)  
キーワード(1)(和/英) マルチエージェントシステム / Multi-agent System  
キーワード(2)(和/英) 強化学習 / Reinforcement Learning  
キーワード(3)(和/英) Q学習 / Q-learning  
キーワード(4)(和/英) Safety Critical System / Safety Critical System  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 藤原 真一 / Shinichi Fujiwara / フジワラ シンイチ
第1著者 所属(和/英) 大阪大学 (略称: 阪大)
Osaka University (略称: Osaka Univ.)
第2著者 氏名(和/英/ヨミ) 宮本 俊幸 / Toshiyuki Miyamoto / ミヤモト トシユキ
第2著者 所属(和/英) 大阪大学 (略称: 阪大)
Osaka University (略称: Osaka Univ.)
第3著者 氏名(和/英/ヨミ) 熊谷 貞俊 / Sadatoshi Kumagai / クマガイ サダトシ
第3著者 所属(和/英) 大阪大学 (略称: 阪大)
Osaka University (略称: Osaka Univ.)
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2008-01-29 13:55:00 
発表時間 25分 
申込先研究会 MSS 
資料番号 CST2007-53 
巻番号(vol) vol.107 
号番号(no) no.472 
ページ範囲 pp.41-46 
ページ数
発行日 2008-01-22 (CST) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会