講演名 2014-11-21
強化学習を用いた離散事象システムの最適LLPスーパバイザ制御について(グラフ,ペトリネット,ニューラルネット及び一般)
梅本 聖, 山崎 達志,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 大規模で時変する離散事象システムに対して,先読み戦略を用いて対処するLLP(Lmited Lookahead Policy)スーパバイザ制御が提案されている。本稿では複数のサブシステムから構成されるシステムに対して,事象の生起や禁止のコストも考慮した最適LLPスーパバイザ制御を提案する。提案手法では,各サブシステムが強化学習を用いて制御パターンに対する評価を学習するとともに,システム全体では先読み戦略の下で制御仕様を満足しつつ,システム全体に対する評価関数に基づき制御パターンを選択する最適LLPスーパバイザ制御を行う。
抄録(英) LLP (Limited Lookahead Policy) supervisory control has been proposed to control the logical behavior of large scale or time varying discrete event systems. In this paper, we propose an optimal LLP supervisory control method considering the costs of occurrence and disabling events for the system composed of plural subsystems. In the proposed method, each subsystem learns the evaluation for control patterns based on reinforcement learning. The LLP supervisor selects the optimal control pattern based on the value function within the given specifications.
キーワード(和) スーパバイザ制御 / 離散事象システム / 先読み戦略 / 最適制御 / 強化学習
キーワード(英) supervisory control / discrete event system / limited lookahead policy / optimal control / reinforcement learning
資料番号 CAS2014-102,MSS2014-66
発行日

研究会情報
研究会 MSS
開催期間 2014/11/13(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Mathematical Systems Science and its applications(MSS)
本文の言語 JPN
タイトル(和) 強化学習を用いた離散事象システムの最適LLPスーパバイザ制御について(グラフ,ペトリネット,ニューラルネット及び一般)
サブタイトル(和)
タイトル(英) On optimal LLP supervisory control of discrete event systems based on reinforcement learning
サブタイトル(和)
キーワード(1)(和/英) スーパバイザ制御 / supervisory control
キーワード(2)(和/英) 離散事象システム / discrete event system
キーワード(3)(和/英) 先読み戦略 / limited lookahead policy
キーワード(4)(和/英) 最適制御 / optimal control
キーワード(5)(和/英) 強化学習 / reinforcement learning
第 1 著者 氏名(和/英) 梅本 聖 / Hijiri UMEMOTO
第 1 著者 所属(和/英) 摂南大学大学院理工学研究科
Graduate School of Science and Technology, Setsunan University
第 2 著者 氏名(和/英) 山崎 達志 / Tatsushi YAMASAKI
第 2 著者 所属(和/英) 摂南大学理工学部
Faculty of Science and Technology, Setsunan University
発表年月日 2014-11-21
資料番号 CAS2014-102,MSS2014-66
巻番号(vol) vol.114
号番号(no) 313
ページ範囲 pp.-
ページ数 6
発行日