お知らせ 研究会の開催と会場に参加される皆様へのお願い(2020年10月開催~)
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2016-01-20 16:35
PEACH3の通信性能評価
金田隆大鶴田千晴慶大)・塙 敏博東大)・天野英晴慶大VLD2015-96 CPSY2015-128 RECONF2015-78
抄録 (和) 近年,グラフィックプロセッサ(Graphic Processing Unit,以下GPU)の一般目的への利用(General Purpose computation using on GPUs,以下GPGPU)の普及が進み,複数のGPUを利用するヘテロジーニアスクラスタがハイパフォーマンスコンピューティングの分野において一般的になってきた.
しかしながら,ノードをまたいだGPU同士の通信はそれぞれのホストCPUのメモリを介した間接的通信を行う必要があり,通信遅延が大きい点が問題である.

そこで,筑波大学計算科学研究センターは,GPU同士の直接通信を可能とするPEACH2(PCI-Express Adaptive Communication Hub 2)を利用することで複数のGPUを密に接続することができる密結合並列演算加速機構(Tightly Coupled Accelerators, TCA)を提案した.
しかしPEACH2は通信にPCIe Gen 2 x8を利用しており,バンド幅が不足していた.
そのためPCIe Gen 3 x8を利用できるPEACH3を新たに開発した.
本報告では,このPEACH3を用いた通信テストを行い,PEACH3の性能の評価を行った.
CPU-GPU通信ではCUDA APIに比べ2倍の高バンド幅,低レイテンシを達成した.
GPU-GPU通信ではPEACH2とバンド幅,レイテンシともにおおよそ同等の通信性能を達成できる事が確認できた.
CPU-CPU通信では過去に測定したドライバレベルの通信と今回APIを利用した通信と比較したところドライバレベルの通信と同程度の通信を実現した. 
(英) A recent rapid increase of GPU performance makes GPGPU (General Purpose Computation using on GPUs) a mainstream of high performance computing.
For a large scale target, multi-GPU systems in which a node with a few GPUs are connected through each host CPU have become popular.
However, such systems suffer a large latency to communicate between GPUs attached to different hosts.

In order to cope with this problem, Center for Computational Sciences, University of Tsukuba has developed a tightly couple accelerators (TCA) architecture which connects a large number of GPUs directly with dedicated switches PEACH2 (PCI-Express Adaptive Communication Hub 2).
PEACH2 connects a host directly with PCI express Generation 2 x8, and forms a ring network by connecting neighboring PEACH2 switches directly also with PCI express.
But, the PCIe Gen 2 protocol's bandwidths are smaller for the HPC.
We developed the new board, PEACH3 with PCIe Gen 3 x8.
In this report, We had a communication test and evaluated the performance of the PEACH3, and we achieved about twice higher bandwidth and lower latency as compared to the CUDA API in CPU-GPU communication within the node.
In GPU-GPU communication that's across the nodes, PEACH3s have achieved almost the same performance as PEACH2s.
Even if a communication driver level compared to CPU-CPU communication, by utilizing the API was less performance loss.
キーワード (和) ヘテロジーニアスクラスタ / アクセラレータ / GPU / TCA / PEACH3 / / /  
(英) Heterogeneous cluster / Accelerator / GPU / TCA / PEACH3 / / /  
文献情報 信学技報, vol. 115, no. 399, CPSY2015-128, pp. 155-160, 2016年1月.
資料番号 CPSY2015-128 
発行日 2016-01-12 (VLD, CPSY, RECONF) 
ISSN Print edition: ISSN 0913-5685  Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード VLD2015-96 CPSY2015-128 RECONF2015-78

研究会情報
研究会 VLD CPSY RECONF IPSJ-SLDM IPSJ-ARC  
開催期間 2016-01-19 - 2016-01-21 
開催地(和) 慶應義塾大学 日吉キャンパス 
開催地(英) Hiyoshi Campus, Keio University 
テーマ(和) FPGA応用および一般 
テーマ(英) FPGA Applications, etc 
講演論文情報の詳細
申込み研究会 CPSY 
会議コード 2016-01-VLD-CPSY-RECONF-SLDM-ARC 
本文の言語 日本語 
タイトル(和) PEACH3の通信性能評価 
サブタイトル(和)  
タイトル(英) A performance evaluation of PEACH3 
サブタイトル(英)  
キーワード(1)(和/英) ヘテロジーニアスクラスタ / Heterogeneous cluster  
キーワード(2)(和/英) アクセラレータ / Accelerator  
キーワード(3)(和/英) GPU / GPU  
キーワード(4)(和/英) TCA / TCA  
キーワード(5)(和/英) PEACH3 / PEACH3  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 金田 隆大 / Takahiro Kaneda / カネダ タカヒロ
第1著者 所属(和/英) 慶應義塾大学 (略称: 慶大)
Keio University (略称: Keio Univ)
第2著者 氏名(和/英/ヨミ) 鶴田 千晴 / Chiharu Tsuruta / ツルタ チハル
第2著者 所属(和/英) 慶應義塾大学 (略称: 慶大)
Keio University (略称: Keio Univ)
第3著者 氏名(和/英/ヨミ) 塙 敏博 / Toshihiro Hanawa / ハナワ トシヒロ
第3著者 所属(和/英) 東京大学 (略称: 東大)
The University Tokyo (略称: UTokyo)
第4著者 氏名(和/英/ヨミ) 天野 英晴 / Hideharu Amano / アマノ ヒデハル
第4著者 所属(和/英) 慶應義塾大学 (略称: 慶大)
Keio University (略称: Keio Univ)
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者
発表日時 2016-01-20 16:35:00 
発表時間 25 
申込先研究会 CPSY 
資料番号 IEICE-VLD2015-96,IEICE-CPSY2015-128,IEICE-RECONF2015-78 
巻番号(vol) IEICE-115 
号番号(no) no.398(VLD), no.399(CPSY), no.400(RECONF) 
ページ範囲 pp.155-160 
ページ数 IEICE-6 
発行日 IEICE-VLD-2016-01-12,IEICE-CPSY-2016-01-12,IEICE-RECONF-2016-01-12 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会