強化学習に基づく分散離散事象システムの最適スーパバイザ制御(システムと信号処理及び一般)

梶原 弘治; 山崎 達志

講演名	2010-06-22 強化学習に基づく分散離散事象システムの最適スーパバイザ制御(システムと信号処理及び一般) 梶原弘治, 山崎達志,
PDFダウンロードページ	PDFダウンロードページへ
抄録(和)	著者らはこれまでに,強化学習に基づく最適スーパバイザ制御の一般化の検討を行っている.そこでは,評価値に重み関数を導入し,強化学習により様々なタイプのスーパバイザを設計できることを示した.本報告では,その手法を拡張し分散離散事象システム(DDES; Decentralized Discrete Event System)に対する最適スーパバイザ制御を提案する.対象とする離散事象システムを複数の独立したローカルシステムからなる分散離散事象システムとしてモデル化する.各ローカルシステムとスーパバイザは,振る舞いに対して何らかの好みや特徴を持っているとする.そして,これらを表現する選好関数を考え,それに基づいた新たな評価値を導入する.スーパバイザは分散離散事象システムに対して評価値を最大にする制御パターンの与え方を学習する.計算機実験により,最適な制御パターンが学習できることを示し,提案手法の有効性を示す.
抄録(英)	In our previous work, we have proposed a generalized framework of optimal supervisory control based on reinforcement learning. Then, we introduced weight functions to value functions and showed various types of supervisors. This paper proposes the optimal supervisory control for a decentralized system based on reinforcement learning. We model a Decentralized Discrete Event System (DDES) which consists of several local DESs. Each local DES and the supervisor have preferences for the behavior. So, we introduce preference functions to represent them and the new value functions based on the preference functions. A supervisor learns how to assign the control pattern based on the reinforcement learning so as to maximize value functions. We show the efficiency of the proposed method by computer simulation.
キーワード(和)	離散事象システム / スーパバイザ制御 / 強化学習 / 分散システム / 最適制御
キーワード(英)	discrete event systems / supervisory control / reinforcement learning / decentralized system / optimal control
資料番号	CAS2010-26,VLD2010-36,SIP2010-47,CST2010-26
発行日

研究会情報
研究会	VLD
開催期間	2010/6/14(から1日開催)
開催地（和）
開催地（英）
テーマ（和）
テーマ（英）
委員長氏名（和）
委員長氏名（英）
副委員長氏名（和）
副委員長氏名（英）
幹事氏名（和）
幹事氏名（英）
幹事補佐氏名（和）
幹事補佐氏名（英）

講演論文情報詳細
申込み研究会	VLSI Design Technologies (VLD)
本文の言語	JPN
タイトル（和）	強化学習に基づく分散離散事象システムの最適スーパバイザ制御(システムと信号処理及び一般)
サブタイトル（和）
タイトル（英）	An Optimal Supervisory Control for Decentralized Discrete Event System based on Reinforcement Learning
サブタイトル（和）
キーワード(1)（和/英）	離散事象システム / discrete event systems
キーワード(2)（和/英）	スーパバイザ制御 / supervisory control
キーワード(3)（和/英）	強化学習 / reinforcement learning
キーワード(4)（和/英）	分散システム / decentralized system
キーワード(5)（和/英）	最適制御 / optimal control
第 1 著者氏名（和/英）	梶原弘治 / Kouji KAJIWARA
第 1 著者所属（和/英）	摂南大学大学院工学研究科 Graduate School of Engineering, Setsunan University
第 2 著者氏名（和/英）	山崎達志 / Tatsushi YAMASAKI
第 2 著者所属（和/英）	摂南大学大学院工学研究科 Graduate School of Engineering, Setsunan University
発表年月日	2010-06-22
資料番号	CAS2010-26,VLD2010-36,SIP2010-47,CST2010-26
巻番号（vol）	vol.110
号番号（no）	87
ページ範囲	pp.-
ページ数	6
発行日