講演名 | 2020-08-25 広域データセンター間通信における深層強化学習を適用したPolicy Gradientによるデッドラインアウェアなデータ転送 能登谷 将紀(東京都市大), 塩本 公平(東京都市大), 栗本 崇(NII), |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | デッドラインアウェアなジョブのスケジューリング問題は,科学的ワークフローや商用データセンタの広域ネットワークなどの応用分野で注目されている.デッドラインアウェアなジョブのスケジューリングは簡単な作業ではない.対応するデッドラインまでにすべての要求を満たすためには,将来の時間に沿ってトラフィックを最適に分散させる必要がある.既存の手法は最適化問題を定式化しているが,ほとんどの場合,計算コストがかかる.また,各最適化問題を解く際には,限られた将来の情報しか得られないため,一連の最適化問題を実行した場合の累積的な効果は非常に悪いものとなる.本論文では,深層強化学習を適用したPolicy Gradient を利用して,新しいデッドラインアウェアなジョブスケジューリング手法を構築する.シミュレーションの結果,以下のような知見が得られた.EDF を用いた初期方策は,ランダムな初期方策よりも優れている.提案手法は,RR,FCFS,EDF などの既存手法より高い性能を持ち,トラフィック負荷の増加に伴いEDF より約1.1 倍の性能を発揮する. |
抄録(英) | Deadline-aware job scheduling problems have been attracting attention in the application domains of scientific workflows and commercial data-center wide area networks. The scheduling of deadline-aware jobs is not an easy task. Satisfying all of the demands before the corresponding deadlines requires optimally spreading traffic along future times. Existing methods formulate an optimization problem which in most cases is computationally expensive. The cumulative effect of running a sequence of optimization problems can be very poor since only limited knowledge of the future is available when each optimization problem is solved. In this paper, we leverage a deep reinforcement learning, Policy Gradient, to build a novel deadline-aware job scheduling method. Through the simulation, we obtain the following findings. The EDF-trained initial policy outperforms a random initial policy. The proposed method outperforms the existing methods including RR, FCFS, and EDF with wider gaps from the existing methods expand as the traffic load increases. |
キーワード(和) | デッドライン / 高速回線 / データセンタ / ジョブスケジューリング / 深層強化学習 / Policy Gradient |
キーワード(英) | Deadline / High Speed Network / Data Center / Job Scheduling / Deep Reinforcement Learning / Policy Gradient |
資料番号 | PN2020-21 |
発行日 | 2020-08-17 (PN) |
研究会情報 | |
研究会 | PN |
---|---|
開催期間 | 2020/8/24(から2日開催) |
開催地(和) | オンライン開催 |
開催地(英) | Online |
テーマ(和) | フォトニックネットワーク関連技術、一般 |
テーマ(英) | |
委員長氏名(和) | 釣谷 剛宏(KDDI総合研究所) |
委員長氏名(英) | Takehiro Tsuritani(KDDI Research) |
副委員長氏名(和) | 大越 春喜(古河電工) / 塩本 公平(東京都市大) / 古川 英昭(NICT) |
副委員長氏名(英) | Haruki Ogoshi(Furukawa Electric) / Kohei Shiomoto(Tokyo City Univ.) / Hideaki Furukawa(NICT) |
幹事氏名(和) | 中川 雅弘(NTT) / 松浦 基晴(電通大) |
幹事氏名(英) | Masahiro Nakagawa(NTT) / Motoharu Matsuura(Univ. of Electr-Comm.) |
幹事補佐氏名(和) | 小玉 崇宏(香川大) / 石井 健二(三菱電機) |
幹事補佐氏名(英) | Takahiro Kodama(Kagawa Univ) / Kenji Ishii(Mitsubishi Electric) |
講演論文情報詳細 | |
申込み研究会 | Technical Committee on Photonic Network |
---|---|
本文の言語 | JPN |
タイトル(和) | 広域データセンター間通信における深層強化学習を適用したPolicy Gradientによるデッドラインアウェアなデータ転送 |
サブタイトル(和) | |
タイトル(英) | Policy Gradient-based Deep Reinforcement Learning for Deadline-aware Data Transfer over Wide Area Networks |
サブタイトル(和) | |
キーワード(1)(和/英) | デッドライン / Deadline |
キーワード(2)(和/英) | 高速回線 / High Speed Network |
キーワード(3)(和/英) | データセンタ / Data Center |
キーワード(4)(和/英) | ジョブスケジューリング / Job Scheduling |
キーワード(5)(和/英) | 深層強化学習 / Deep Reinforcement Learning |
キーワード(6)(和/英) | Policy Gradient / Policy Gradient |
第 1 著者 氏名(和/英) | 能登谷 将紀 / Masaki Notoya |
第 1 著者 所属(和/英) | 東京都市大学(略称:東京都市大) Tokyo City University(略称:Tokyo City Univ.) |
第 2 著者 氏名(和/英) | 塩本 公平 / Kohei Shiomoto |
第 2 著者 所属(和/英) | 東京都市大学(略称:東京都市大) Tokyo City University(略称:Tokyo City Univ.) |
第 3 著者 氏名(和/英) | 栗本 崇 / Takashi Kurimoto |
第 3 著者 所属(和/英) | 国立情報学研究所(略称:NII) National Institute of Informatics(略称:NII) |
発表年月日 | 2020-08-25 |
資料番号 | PN2020-21 |
巻番号(vol) | vol.120 |
号番号(no) | PN-137 |
ページ範囲 | pp.49-56(PN), |
ページ数 | 8 |
発行日 | 2020-08-17 (PN) |