講演名 2015-03-05
状態遷移モデルの学習に基づく最適LLPスーパバイザの構成(離散事象システム及び一般)
梅本 聖, 山崎 達志,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 複数のサブシステムから構成される離散事象システムに対し,著者らは強化学習を用いた最適LLPスーパバイザ制御を提案している。本稿では以前に提案した手法に,状態遷移モデルを逐次推定する学習を導入し,コスト情報だけでなく状態遷移モデルも未知な場合に対応できるようにした。また,サブシステムの状態がその事象の生起によって同時に遷移する共通事象の扱いについて検討した。さらに,処理時間に対する時間制約を考慮し,先読みステップ数を動的に調節する拡張を行った。
抄録(英) The authors have proposed an optimal LLP supervisory control method based on reinforcement learning for discrete event systems composed of subsystems. In this paper, we extend the previous work to estimate state transition probability model. It makes it possible to apply the method without cost information and state transition model a priori. In addition, we consider the case that the states of different subsystems change at the same time by the occurrence of an event. We also propose a method of dynamic adjustment of the number of lookahead steps in consideration of the real-time constraints of the system.
キーワード(和) スーパバイザ制御 / 離散事象システム / 先読み戦略 / 最適制御 / 強化学習
キーワード(英) supervisory control / discrete event system / limited lookahead policy / optimal control / reinforcement learning
資料番号 MSS2014-92
発行日

研究会情報
研究会 MSS
開催期間 2015/2/26(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Mathematical Systems Science and its applications(MSS)
本文の言語 JPN
タイトル(和) 状態遷移モデルの学習に基づく最適LLPスーパバイザの構成(離散事象システム及び一般)
サブタイトル(和)
タイトル(英) Optimal LLP supervisory control based on the learning of state transition model
サブタイトル(和)
キーワード(1)(和/英) スーパバイザ制御 / supervisory control
キーワード(2)(和/英) 離散事象システム / discrete event system
キーワード(3)(和/英) 先読み戦略 / limited lookahead policy
キーワード(4)(和/英) 最適制御 / optimal control
キーワード(5)(和/英) 強化学習 / reinforcement learning
第 1 著者 氏名(和/英) 梅本 聖 / Hijiri UMEMOTO
第 1 著者 所属(和/英) 摂南大学大学院理工学研究科
Graduate School of Science and Technology, Setsunan University
第 2 著者 氏名(和/英) 山崎 達志 / Tatsushi YAMASAKI
第 2 著者 所属(和/英) 摂南大学理工学部
Faculty of Science and Technology, Setsunan University
発表年月日 2015-03-05
資料番号 MSS2014-92
巻番号(vol) vol.114
号番号(no) 493
ページ範囲 pp.-
ページ数 6
発行日