講演抄録/キーワード |
講演名 |
2012-10-31 16:45
GPUのための並列計算モデル ○小池 敦・定兼邦彦(NII) COMP2012-42 |
抄録 |
(和) |
GPUのための新しい並列計算モデルを提案する.並列計算モデルとして一般的に使用されるPRAMモデルは GPUアルゴリズムの評価には適していない.我々の提案するAGPUモデルはGPUアーキテクチャの良い抽象化となっており,グローバルメモリへのコアレスアクセスや共有メモリのバンクコンフリクトについても考慮され る.AGPUモデルは既存のモデルよりもアルゴリズムの漸近解析に適しており,本モデルを使用することで様々なGPUアーキテクチャ上で効率よく動作するアルゴリズムを開発することができる.本モデルを使用したアルゴリズム解析の例として,リダクション計算を取り上げる.GPUを用いたリダクション計算には,大きく分類してTree-basedとCascadingの2種類のアルゴリズムがある.実際のGPUでの計算では後者は前者よりも高速に動作する.我々はAGPUモデルによるアルゴリズムの解析を行い,本モデルにおいても後者のほうが時間計算量が小さくなっていることを示す.また,本報告では非可換演算を用いたリダクション計算に対する新しいアルゴリズムを提案し,本モデルおよび実際の計算時間が共に小さくなることを示す. |
(英) |
We propose a novel computation model for GPU. Known parallel computation models such as the PRAM model are not appropriate for evaluating GPU algorithms. Our model, called AGPU, abstracts the essence of current GPU architectures such as global and shared memory, memory coalescing and bank conflicts. We can therefore evaluate asymptotic behavior of GPU algorithms more accurately than known models and we can develop algorithms which are efficient on many real architectures. As an example of algorithm analyses using our model, we analyze complexities of reduction algorithms. There exist two main algorithms for reduction: tree-based algorithm and cascading algorithm. The latter is faster than the former in practice, and we can give an evidence; the latter has lower time complexity in the AGPU model than the former. We also give a novel and efficient algorithm for reduction for the case the reduction operator is non-commutative. |
キーワード |
(和) |
GPGPU / 並列計算モデル / リダクションアルゴリズム / / / / / |
(英) |
GPGPU / parallel computation model / reduction algorithms / / / / / |
文献情報 |
信学技報, vol. 112, no. 272, COMP2012-42, pp. 53-60, 2012年10月. |
資料番号 |
COMP2012-42 |
発行日 |
2012-10-24 (COMP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
COMP2012-42 |