広域データセンター間通信における深層強化学習を適用したPolicy Gradientによるデッドラインアウェアなデータ転送

能登谷 将紀; 塩本 公平; 栗本 崇

講演名	2020-08-25 広域データセンター間通信における深層強化学習を適用したPolicy Gradientによるデッドラインアウェアなデータ転送能登谷将紀(東京都市大), 塩本公平(東京都市大), 栗本崇(NII),
PDFダウンロードページ	PDFダウンロードページへ
抄録(和)	デッドラインアウェアなジョブのスケジューリング問題は，科学的ワークフローや商用データセンタの広域ネットワークなどの応用分野で注目されている．デッドラインアウェアなジョブのスケジューリングは簡単な作業ではない．対応するデッドラインまでにすべての要求を満たすためには，将来の時間に沿ってトラフィックを最適に分散させる必要がある．既存の手法は最適化問題を定式化しているが，ほとんどの場合，計算コストがかかる．また，各最適化問題を解く際には，限られた将来の情報しか得られないため，一連の最適化問題を実行した場合の累積的な効果は非常に悪いものとなる．本論文では，深層強化学習を適用したPolicy Gradient を利用して，新しいデッドラインアウェアなジョブスケジューリング手法を構築する．シミュレーションの結果，以下のような知見が得られた．EDF を用いた初期方策は，ランダムな初期方策よりも優れている．提案手法は，RR，FCFS，EDF などの既存手法より高い性能を持ち，トラフィック負荷の増加に伴いEDF より約1.1 倍の性能を発揮する．
抄録(英)	Deadline-aware job scheduling problems have been attracting attention in the application domains of scientific workflows and commercial data-center wide area networks. The scheduling of deadline-aware jobs is not an easy task. Satisfying all of the demands before the corresponding deadlines requires optimally spreading traffic along future times. Existing methods formulate an optimization problem which in most cases is computationally expensive. The cumulative effect of running a sequence of optimization problems can be very poor since only limited knowledge of the future is available when each optimization problem is solved. In this paper, we leverage a deep reinforcement learning, Policy Gradient, to build a novel deadline-aware job scheduling method. Through the simulation, we obtain the following findings. The EDF-trained initial policy outperforms a random initial policy. The proposed method outperforms the existing methods including RR, FCFS, and EDF with wider gaps from the existing methods expand as the traffic load increases.
キーワード(和)	デッドライン / 高速回線 / データセンタ / ジョブスケジューリング / 深層強化学習 / Policy Gradient
キーワード(英)	Deadline / High Speed Network / Data Center / Job Scheduling / Deep Reinforcement Learning / Policy Gradient
資料番号	PN2020-21
発行日	2020-08-17 (PN)

研究会情報
研究会	PN
開催期間	2020/8/24(から2日開催)
開催地（和）	オンライン開催
開催地（英）	Online
テーマ（和）	フォトニックネットワーク関連技術、一般
テーマ（英）
委員長氏名（和）	釣谷剛宏(KDDI総合研究所)
委員長氏名（英）	Takehiro Tsuritani(KDDI Research)
副委員長氏名（和）	大越春喜(古河電工) / 塩本公平(東京都市大) / 古川英昭(NICT)
副委員長氏名（英）	Haruki Ogoshi(Furukawa Electric) / Kohei Shiomoto(Tokyo City Univ.) / Hideaki Furukawa(NICT)
幹事氏名（和）	中川雅弘(NTT) / 松浦基晴(電通大)
幹事氏名（英）	Masahiro Nakagawa(NTT) / Motoharu Matsuura(Univ. of Electr-Comm.)
幹事補佐氏名（和）	小玉崇宏(香川大) / 石井健二(三菱電機)
幹事補佐氏名（英）	Takahiro Kodama(Kagawa Univ) / Kenji Ishii(Mitsubishi Electric)

講演論文情報詳細
申込み研究会	Technical Committee on Photonic Network
本文の言語	JPN
タイトル（和）	広域データセンター間通信における深層強化学習を適用したPolicy Gradientによるデッドラインアウェアなデータ転送
サブタイトル（和）
タイトル（英）	Policy Gradient-based Deep Reinforcement Learning for Deadline-aware Data Transfer over Wide Area Networks
サブタイトル（和）
キーワード(1)（和/英）	デッドライン / Deadline
キーワード(2)（和/英）	高速回線 / High Speed Network
キーワード(3)（和/英）	データセンタ / Data Center
キーワード(4)（和/英）	ジョブスケジューリング / Job Scheduling
キーワード(5)（和/英）	深層強化学習 / Deep Reinforcement Learning
キーワード(6)（和/英）	Policy Gradient / Policy Gradient
第 1 著者氏名（和/英）	能登谷将紀 / Masaki Notoya
第 1 著者所属（和/英）	東京都市大学(略称：東京都市大) Tokyo City University(略称：Tokyo City Univ.)
第 2 著者氏名（和/英）	塩本公平 / Kohei Shiomoto
第 2 著者所属（和/英）	東京都市大学(略称：東京都市大) Tokyo City University(略称：Tokyo City Univ.)
第 3 著者氏名（和/英）	栗本崇 / Takashi Kurimoto
第 3 著者所属（和/英）	国立情報学研究所(略称：NII) National Institute of Informatics(略称：NII)
発表年月日	2020-08-25
資料番号	PN2020-21
巻番号（vol）	vol.120
号番号（no）	PN-137
ページ範囲	pp.49-56(PN),
ページ数	8
発行日	2020-08-17 (PN)