講演名 | 2015-03-05 状態遷移モデルの学習に基づく最適LLPスーパバイザの構成(離散事象システム及び一般) 梅本 聖, 山崎 達志, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 複数のサブシステムから構成される離散事象システムに対し,著者らは強化学習を用いた最適LLPスーパバイザ制御を提案している。本稿では以前に提案した手法に,状態遷移モデルを逐次推定する学習を導入し,コスト情報だけでなく状態遷移モデルも未知な場合に対応できるようにした。また,サブシステムの状態がその事象の生起によって同時に遷移する共通事象の扱いについて検討した。さらに,処理時間に対する時間制約を考慮し,先読みステップ数を動的に調節する拡張を行った。 |
抄録(英) | The authors have proposed an optimal LLP supervisory control method based on reinforcement learning for discrete event systems composed of subsystems. In this paper, we extend the previous work to estimate state transition probability model. It makes it possible to apply the method without cost information and state transition model a priori. In addition, we consider the case that the states of different subsystems change at the same time by the occurrence of an event. We also propose a method of dynamic adjustment of the number of lookahead steps in consideration of the real-time constraints of the system. |
キーワード(和) | スーパバイザ制御 / 離散事象システム / 先読み戦略 / 最適制御 / 強化学習 |
キーワード(英) | supervisory control / discrete event system / limited lookahead policy / optimal control / reinforcement learning |
資料番号 | MSS2014-92 |
発行日 |
研究会情報 | |
研究会 | MSS |
---|---|
開催期間 | 2015/2/26(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Mathematical Systems Science and its applications(MSS) |
---|---|
本文の言語 | JPN |
タイトル(和) | 状態遷移モデルの学習に基づく最適LLPスーパバイザの構成(離散事象システム及び一般) |
サブタイトル(和) | |
タイトル(英) | Optimal LLP supervisory control based on the learning of state transition model |
サブタイトル(和) | |
キーワード(1)(和/英) | スーパバイザ制御 / supervisory control |
キーワード(2)(和/英) | 離散事象システム / discrete event system |
キーワード(3)(和/英) | 先読み戦略 / limited lookahead policy |
キーワード(4)(和/英) | 最適制御 / optimal control |
キーワード(5)(和/英) | 強化学習 / reinforcement learning |
第 1 著者 氏名(和/英) | 梅本 聖 / Hijiri UMEMOTO |
第 1 著者 所属(和/英) | 摂南大学大学院理工学研究科 Graduate School of Science and Technology, Setsunan University |
第 2 著者 氏名(和/英) | 山崎 達志 / Tatsushi YAMASAKI |
第 2 著者 所属(和/英) | 摂南大学理工学部 Faculty of Science and Technology, Setsunan University |
発表年月日 | 2015-03-05 |
資料番号 | MSS2014-92 |
巻番号(vol) | vol.114 |
号番号(no) | 493 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |