講演名 | 2011-05-13 低メモリ帯域で高性能ステンシル計算を実現するスケーラブルストリーミングアレイの試作と評価(科学技術計算) 佐野 健太郎, 初田 義明, 高野 芳彰, 山本 悟, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | ステンシル計算は科学技術計算において重要な計算カーネルの一つであるものの、その小さな演算密度のために、マルチコアプロセッサやGPGPUでは限られたメモリ帯域により実効性能が制約されてしまう。本研究では、複数のFPGAから成るシステムにおいて高性能ステンシル計算を実現するスケーラブルストリーミングアレイ(SSA)を提案する。SSAは、多段のパイプライン処理により、一定の外部メモリ帯域に対して線形の速度向上を実現する。本稿では、SSAの設計を示すと共に、複数のFPGAに対する性能モデルを導出する。9つのStratix III FPGAを用いて実装されたSSAは、僅か2GB/sの外部メモリ帯域に対してピーク性能の87.4%にあたる260GFlop/sの2次元ヤコビ計算を実現した。これは、中規模以上の計算サイズ対して得られる線形の速度向上によるものである。 |
抄録(英) | Stencil computation is one of the important kernels in scientific computations, however, the sustained performance is limited by memory bandwidth on multi-core processors and GPGPUs due to its small operational-intensity. In this paper, we propose a scalable streaming-array (SSA), which allows multiple FPGAs to achieve linearly-scalable stencil computation by deeply pipelining with a constant external-memory bandwidth. We present a design of SSA and formulate a performance model of the pipelined execution. For 2D Jacobi computations, SSA implemented on nine Stratix III FPGAs with the memory bandwidth of only 2 GB/s achieves 260 GFlop/s, corresponding to 87.4 % of the peak, due to the linear speedup obtained for larger than medium-sized computation. |
キーワード(和) | 高性能計算 / ステンシル計算 / スケーラブルストリーミングアレイ / FPGA |
キーワード(英) | high-performance computation / stencil computation / scalable streaming-array / FPGA |
資料番号 | RECONF2011-14 |
発行日 |
研究会情報 | |
研究会 | RECONF |
---|---|
開催期間 | 2011/5/5(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Reconfigurable Systems (RECONF) |
---|---|
本文の言語 | JPN |
タイトル(和) | 低メモリ帯域で高性能ステンシル計算を実現するスケーラブルストリーミングアレイの試作と評価(科学技術計算) |
サブタイトル(和) | |
タイトル(英) | Evaluation of Scalable Streaming Array for High-Performance Stencil Computation with Low Memory Bandwidth |
サブタイトル(和) | |
キーワード(1)(和/英) | 高性能計算 / high-performance computation |
キーワード(2)(和/英) | ステンシル計算 / stencil computation |
キーワード(3)(和/英) | スケーラブルストリーミングアレイ / scalable streaming-array |
キーワード(4)(和/英) | FPGA / FPGA |
第 1 著者 氏名(和/英) | 佐野 健太郎 / Kentaro SANO |
第 1 著者 所属(和/英) | 東北大学大学院情報科学研究科 Graduate School of Information Sciences, Tohoku University |
第 2 著者 氏名(和/英) | 初田 義明 / Yoshiaki HATSUDA |
第 2 著者 所属(和/英) | 株式会社工房 Kobo Co. Ltd |
第 3 著者 氏名(和/英) | 高野 芳彰 / Yoshiaki KONO |
第 3 著者 所属(和/英) | 東北大学大学院情報科学研究科 Graduate School of Information Sciences, Tohoku University |
第 4 著者 氏名(和/英) | 山本 悟 / Satoru YAMAMOTO |
第 4 著者 所属(和/英) | 東北大学大学院情報科学研究科 Graduate School of Information Sciences, Tohoku University |
発表年月日 | 2011-05-13 |
資料番号 | RECONF2011-14 |
巻番号(vol) | vol.111 |
号番号(no) | 31 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |