講演抄録/キーワード |
講演名 |
2014-11-28 10:05
メモリネットワークベースアクセラレータの試作と評価 ○清水 怜・田ノ元正和・高前田(山崎) 伸也・姚 駿・中島康彦(奈良先端大) CPSY2014-81 |
抄録 |
(和) |
我々は,ステンシル計算のデータ再利用性に着目し,内部に小規模なメモリを分散配置してデータ移動を小限に抑えたアレイ型アクセラレータ (Energy-aware Multimode Accelerator eXtension : EMAX) を提案してきた.本稿では,試作したチップから得られた分析結果を元にメモリバンド幅を使い切るのに最適な実装方法を検討し,複数チップ構成時の性能を評価する.GeForce GTX 780 と比較したところ,ピークメモリバンド幅あたりで 4 倍の性能を達成できることを確認した. |
(英) |
In this research, we focus on the data parallelization of stencil computations on a previously proposed memory-network based accelerator, named Energy-Aware Multimode Accelerator Extension (EMAX). EMAX uses
a distributed memory network and a corresponding functional unit (FU) network to exploit data reuse chance in stencil computations and achieves a minimal data movement. We design and implement a prototype chip of EMAX.
In this work, we study the scheduling of a multi-EMAX platform, and the macro-pipelining scheme in EMAX to achieve the best memory bandwidth utilization. With these techniques, EMAX achieves 4x performance per
bandwidth of GTX780 in processing stencil kernels. |
キーワード |
(和) |
CGRA / アクセラレータ / ステンシル計算 / / / / / |
(英) |
CGRA / Accelerator / Stencil / / / / / |
文献情報 |
信学技報, vol. 114, no. 330, CPSY2014-81, pp. 51-56, 2014年11月. |
資料番号 |
CPSY2014-81 |
発行日 |
2014-11-19 (CPSY) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
CPSY2014-81 |