PEACH3の通信性能評価

金田 隆大; 鶴田 千晴; 塙 敏博; 天野 英晴

講演名	2016-01-20 PEACH3の通信性能評価金田隆大(慶大), 鶴田千晴(慶大), 塙敏博(東大), 天野英晴(慶大),
PDFダウンロードページ	PDFダウンロードページへ
抄録(和)	近年,グラフィックプロセッサ(Graphic Processing Unit,以下GPU)の一般目的への利用(General Purpose computation using on GPUs,以下GPGPU)の普及が進み,複数のGPUを利用するヘテロジーニアスクラスタがハイパフォーマンスコンピューティングの分野において一般的になってきた. しかしながら,ノードをまたいだGPU同士の通信はそれぞれのホストCPUのメモリを介した間接的通信を行う必要があり,通信遅延が大きい点が問題である. そこで,筑波大学計算科学研究センターは,GPU同士の直接通信を可能とするPEACH2(PCI-Express Adaptive Communication Hub 2)を利用することで複数のGPUを密に接続することができる密結合並列演算加速機構(Tightly Coupled Accelerators, TCA)を提案した. しかしPEACH2は通信にPCIe Gen 2 x8を利用しており,バンド幅が不足していた. そのためPCIe Gen 3 x8を利用できるPEACH3を新たに開発した. 本報告では,このPEACH3を用いた通信テストを行い,PEACH3の性能の評価を行った. CPU-GPU通信ではCUDA APIに比べ2倍の高バンド幅,低レイテンシを達成した. GPU-GPU通信ではPEACH2とバンド幅,レイテンシともにおおよそ同等の通信性能を達成できる事が確認できた. CPU-CPU通信では過去に測定したドライバレベルの通信と今回APIを利用した通信と比較したところドライバレベルの通信と同程度の通信を実現した.
抄録(英)	A recent rapid increase of GPU performance makes GPGPU (General Purpose Computation using on GPUs) a mainstream of high performance computing. For a large scale target, multi-GPU systems in which a node with a few GPUs are connected through each host CPU have become popular. However, such systems suffer a large latency to communicate between GPUs attached to different hosts. In order to cope with this problem, Center for Computational Sciences, University of Tsukuba has developed a tightly couple accelerators (TCA) architecture which connects a large number of GPUs directly with dedicated switches PEACH2 (PCI-Express Adaptive Communication Hub 2). PEACH2 connects a host directly with PCI express Generation 2 x8, and forms a ring network by connecting neighboring PEACH2 switches directly also with PCI express. But, the PCIe Gen 2 protocol's bandwidths are smaller for the HPC. We developed the new board, PEACH3 with PCIe Gen 3 x8. In this report, We had a communication test and evaluated the performance of the PEACH3, and we achieved about twice higher bandwidth and lower latency as compared to the CUDA API in CPU-GPU communication within the node. In GPU-GPU communication that's across the nodes, PEACH3s have achieved almost the same performance as PEACH2s. Even if a communication driver level compared to CPU-CPU communication, by utilizing the API was less performance loss.
キーワード(和)	ヘテロジーニアスクラスタ / アクセラレータ / GPU / TCA / PEACH3
キーワード(英)	Heterogeneous cluster / Accelerator / GPU / TCA / PEACH3
資料番号	VLD2015-96,CPSY2015-128,RECONF2015-78
発行日	2016-01-12 (VLD, CPSY, RECONF)

研究会情報
研究会	VLD / CPSY / RECONF / IPSJ-SLDM / IPSJ-ARC
開催期間	2016/1/19(から3日開催)
開催地（和）	慶應義塾大学日吉キャンパス
開催地（英）	Hiyoshi Campus, Keio University
テーマ（和）	FPGA応用および一般
テーマ（英）	FPGA Applications, etc
委員長氏名（和）	松永裕介(九大) / 中島康彦(奈良先端大) / 渡邊実(静岡大) / 福井正博(立命館大) / 五島正裕(国情研)
委員長氏名（英）	Yusuke Matsunaga(Kyushu Univ.) / Yasuhiko Nakashima(NAIST) / Minoru Watanabe(Shizuoka Univ.) / Masahiro Fukui(Ritsumeikan Univ.) / Masahiro Goshima(国情研)
副委員長氏名（和）	竹中崇(NEC) / 中野浩嗣(広島大) / 入江英嗣(東大) / 本村真人(北大) / 柴田裕一郎(長崎大)
副委員長氏名（英）	Takashi Takenana(NEC) / Koji Nakano(Hiroshima Univ.) / Hidetsugu Irie(Univ. of Tokyo) / Masato Motomura(Hokkaido Univ.) / Yuichiro Shibata(Nagasaki Univ.)
幹事氏名（和）	冨山宏之(立命館大) / 福田大輔(富士通研) / 三吉貴史(富士通研) / 鯉渕道紘(NII) / 山田裕(東芝) / 山口佳樹(筑波大) / 横山昌生(シャープ) / 高島康裕(北九州市大) / 西出岳央(東芝) / 小野貴継(九大) / 津邑公暁(名工大) / 三輪忍(電通大) / 山下浩一郎(富士通研)
幹事氏名（英）	Hiroyuki Tomiyama(Ritsumeikan Univ.) / Daisuke Fukuda(Fujitsu Labs.) / Takashi Miyoshi(Fujitsu Labs.) / Michihiro Koibuchi(NII) / Yutaka Yamada(Toshiba) / Yoshiki Yamaguchi(Univ. of Tsukuba) / Masao Yokoyama(Sharp) / Yasuhiro Takashima(Kitakyushu City Univ.) / Takeo Nishide(Toshiba) / Takatsugu Ono(九大) / Tomoaki Tsumura(名工大) / Shinobu Miwa(電通大) / Koichiro Yamashita(富士通研)
幹事補佐氏名（和）	谷口一徹(立命館大) / 高前田伸也(奈良先端大) / 大川猛(宇都宮大) / 谷川一哉(広島市大) / 三好健文(イーツリーズ・ジャパン)
幹事補佐氏名（英）	Ittetsu Taniguchi(Ritsumeikan Univ.) / Shinya Takameda(NAIST) / Takeshi Ohkawa(Utsunomiya Univ.) / Kazuya Tanikagawa(Hiroshima City Univ.) / Takefumi Miyoshi(e-trees.Japan)

講演論文情報詳細
申込み研究会	Technical Committee on VLSI Design Technologies / Technical Committee on Computer Systems / Technical Committee on Reconfigurable Systems / Special Interest Group on System and LSI Design Methodology / Special Interest Group on System Architecture
本文の言語	JPN
タイトル（和）	PEACH3の通信性能評価
サブタイトル（和）
タイトル（英）	A performance evaluation of PEACH3
サブタイトル（和）
キーワード(1)（和/英）	ヘテロジーニアスクラスタ / Heterogeneous cluster
キーワード(2)（和/英）	アクセラレータ / Accelerator
キーワード(3)（和/英）	GPU / GPU
キーワード(4)（和/英）	TCA / TCA
キーワード(5)（和/英）	PEACH3 / PEACH3
第 1 著者氏名（和/英）	金田隆大 / Takahiro Kaneda
第 1 著者所属（和/英）	慶應義塾大学(略称：慶大) Keio University(略称：Keio Univ)
第 2 著者氏名（和/英）	鶴田千晴 / Chiharu Tsuruta
第 2 著者所属（和/英）	慶應義塾大学(略称：慶大) Keio University(略称：Keio Univ)
第 3 著者氏名（和/英）	塙敏博 / Toshihiro Hanawa
第 3 著者所属（和/英）	東京大学(略称：東大) The University Tokyo(略称：UTokyo)
第 4 著者氏名（和/英）	天野英晴 / Hideharu Amano
第 4 著者所属（和/英）	慶應義塾大学(略称：慶大) Keio University(略称：Keio Univ)
発表年月日	2016-01-20
資料番号	VLD2015-96,CPSY2015-128,RECONF2015-78
巻番号（vol）	vol.115
号番号（no）	VLD-398,CPSY-399,RECONF-400
ページ範囲	pp.155-160(VLD), pp.155-160(CPSY), pp.155-160(RECONF),
ページ数	6
発行日	2016-01-12 (VLD, CPSY, RECONF)