講演名 2017-07-28
Apache SparkのGPU利用における冗長なデータ転送の回避
浅井 崚(阪大), 置田 真生(阪大), 萩原 兼一(阪大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) PCクラスタ向け並列分散処理フレームワークApache Sparkの高速化のためにGPUを利用する試みがある.既存実装の1つIBMSparkGPUは,ホストPCとGPU間の冗長なデータ転送を回避するための機構として,ビデオメモリ内キャッシュを備える.このキャッシュの管理はプログラマが明示的に指示する必要がある.本稿では,IBMSparkGPUを拡張子,冗長なデータ転送を自動的に回避する手法を提案する.提案手法は,Sparkのランタイムが提供するデータフローをもとにGPU上で一括実行可能な処理群を特定し,それらの間で冗長なデータ転送が発生しないようにビデオメモリ内キャッシュを管理する.ロジスティック回帰のプログラムに適用した結果,高々2.4%のオーバヘッドで一括処理内の冗長なデータ転送を回避できた.
抄録(英) Apache Spark is a fast and general engine for parallel distributed processing on PC cluster. IBMSparkGPU is a Spark plugin that enables GPU offloading. The IBMSparkGPU provides in-VRAM cache instruction for avoiding data transfer between the host PC and the GPU. Programmers are responsible for this cache management. In this paper, we propose an extention of IBMSparkGPU for automatically avoiding redundant data transfer. The proposed method manages in-VRAM cache so that redundant data transfer does not occur be- tween batched processes on the GPU. The batched processes can be identified by analyzing the data flow provided by Spark runtime. Experimental results show that the proposed method avoids redundant data transfer in a logistic regression program with overhead of at most 2.4%.
キーワード(和) CUDA / デザイン最適化 / ビデオメモリ内キャッシュ
キーワード(英) CUDA / Design optimization / In-VRAM cache
資料番号 CPSY2017-33
発行日 2017-07-19 (CPSY)

研究会情報
研究会 CPSY / DC / IPSJ-ARC
開催期間 2017/7/26(から3日開催)
開催地(和) 秋田アトリオンビル(秋田)
開催地(英) Akita Atorion-Building (Akita)
テーマ(和) 並列/分散/協調とディペンダブルコンピューティングおよび一般
テーマ(英) Parallel, Distributed and Cooperative Processing
委員長氏名(和) 中野 浩嗣(広島大) / 井上 美智子(奈良先端大)
委員長氏名(英) Koji Nakano(Hiroshima Univ.) / Michiko Inoue(NAIST)
副委員長氏名(和) 入江 英嗣(東大) / 三吉 貴史(富士通研) / 福本 聡(首都大東京)
副委員長氏名(英) Hidetsugu Irie(Univ. of Tokyo) / Takashi Miyoshi(Fujitsu) / Satoshi Fukumoto(Tokyo Metropolitan Univ.)
幹事氏名(和) 大川 猛(宇都宮大) / 高前田 伸也(北大) / 吉村 正義(京都産大) / 金子 晴彦(東工大)
幹事氏名(英) Takeshi Ohkawa(Utsunomiya Univ.) / Shinya Takameda(Hokkaido Univ.) / Masayoshi Yoshimura(Kyoto Sangyo Univ.) / Haruhiko Kaneko(Tokyo Inst. of Tech.)
幹事補佐氏名(和) 伊藤 靖朗(広島大) / 津邑 公暁(名工大) / 新井 雅之(日大)
幹事補佐氏名(英) Yasuaki Ito(Hiroshima Univ.) / Tomoaki Tsumura(Nagoya Inst. of Tech.) / Masayuki Arai(Nihon Univ.)

講演論文情報詳細
申込み研究会 Technical Committee on Computer Systems / Technical Committee on Dependable Computing / Special Interest Group on System Architecture
本文の言語 JPN
タイトル(和) Apache SparkのGPU利用における冗長なデータ転送の回避
サブタイトル(和)
タイトル(英) Avoiding redundant data transfer on GPU-enabled Apache Spark
サブタイトル(和)
キーワード(1)(和/英) CUDA / CUDA
キーワード(2)(和/英) デザイン最適化 / Design optimization
キーワード(3)(和/英) ビデオメモリ内キャッシュ / In-VRAM cache
第 1 著者 氏名(和/英) 浅井 崚 / Ryo Asai
第 1 著者 所属(和/英) 大阪大学(略称:阪大)
Osaka University(略称:Osaka Univ.)
第 2 著者 氏名(和/英) 置田 真生 / Masao Okita
第 2 著者 所属(和/英) 大阪大学(略称:阪大)
Osaka University(略称:Osaka Univ.)
第 3 著者 氏名(和/英) 萩原 兼一 / Kenichi Hagihara
第 3 著者 所属(和/英) 大阪大学(略称:阪大)
Osaka University(略称:Osaka Univ.)
発表年月日 2017-07-28
資料番号 CPSY2017-33
巻番号(vol) vol.117
号番号(no) CPSY-153
ページ範囲 pp.185-190(CPSY),
ページ数 6
発行日 2017-07-19 (CPSY)