講演名 2017-07-26
Summed Area Table計算の効率的なGPU実装
柄本 悠太郎(広島大), 本田 巧(広島大), 中野 浩嗣(広島大), 伊藤 靖朗(広島大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本論文では,Summed Area Table (SAT)計算の効率的なGPU実装を提案する.SATを計算する既存のGPU実装は行列を小さな領域に分割し並列に計算を行っている.このとき,領域間で計算の同期をとる必要があり,そのためのカーネル呼び出しにかかるオーバーヘッドが計算時間の遅延をもたらしていた.カーネルとはGPUの実行するプログラムのことで,CUDAは異なるブロック間で同期をとるとき新しいカーネルを起動する必要がある.そこで,提案GPU実装では領域ごとに計算の進捗を管理する状態フラグを用意することで,1度のカーネル呼び出しでSAT計算を行い高速化を実現した.評価実験として提案手法をNVIDIA Titan Xに実装し,実行時間を計測した.その結果,提案手法は既存のGPU実装と比べて最大2.03倍,逐次処理のCPU実装と比べて最大41.68倍の高速化を達成した.
抄録(英) The main contribution of this paper is to show an efficient GPU implementation of computing the summed area table. Existing implementations compute SAT in parallel dividing input matrix into submatrix. In the implementations, to synchronize the computation, the execution is divided into several kernels that are launched in serial. Our implementation adopts status flag to check the progress of computation and calls a kernel only once to compute SAT. In this paper, we show a GPU implementation that can perform a single kernel call on NVIDIA Titan X. The experimental results show that our SAT implementation runs faster at most 2.03 times than existing GPU implementations and 41.68 times faster than sequential algorithm using the CPU.
キーワード(和) summed area table / prefix-sum / GPU / CUDA
キーワード(英) summed area table / prefix-sum / GPU / CUDA
資料番号 CPSY2017-19
発行日 2017-07-19 (CPSY)

研究会情報
研究会 CPSY / DC / IPSJ-ARC
開催期間 2017/7/26(から3日開催)
開催地(和) 秋田アトリオンビル(秋田)
開催地(英) Akita Atorion-Building (Akita)
テーマ(和) 並列/分散/協調とディペンダブルコンピューティングおよび一般
テーマ(英) Parallel, Distributed and Cooperative Processing
委員長氏名(和) 中野 浩嗣(広島大) / 井上 美智子(奈良先端大)
委員長氏名(英) Koji Nakano(Hiroshima Univ.) / Michiko Inoue(NAIST)
副委員長氏名(和) 入江 英嗣(東大) / 三吉 貴史(富士通研) / 福本 聡(首都大東京)
副委員長氏名(英) Hidetsugu Irie(Univ. of Tokyo) / Takashi Miyoshi(Fujitsu) / Satoshi Fukumoto(Tokyo Metropolitan Univ.)
幹事氏名(和) 大川 猛(宇都宮大) / 高前田 伸也(北大) / 吉村 正義(京都産大) / 金子 晴彦(東工大)
幹事氏名(英) Takeshi Ohkawa(Utsunomiya Univ.) / Shinya Takameda(Hokkaido Univ.) / Masayoshi Yoshimura(Kyoto Sangyo Univ.) / Haruhiko Kaneko(Tokyo Inst. of Tech.)
幹事補佐氏名(和) 伊藤 靖朗(広島大) / 津邑 公暁(名工大) / 新井 雅之(日大)
幹事補佐氏名(英) Yasuaki Ito(Hiroshima Univ.) / Tomoaki Tsumura(Nagoya Inst. of Tech.) / Masayuki Arai(Nihon Univ.)

講演論文情報詳細
申込み研究会 Technical Committee on Computer Systems / Technical Committee on Dependable Computing / Special Interest Group on System Architecture
本文の言語 JPN
タイトル(和) Summed Area Table計算の効率的なGPU実装
サブタイトル(和)
タイトル(英) An Efficient GPU Implementation of Computing the Summed Area Table
サブタイトル(和)
キーワード(1)(和/英) summed area table / summed area table
キーワード(2)(和/英) prefix-sum / prefix-sum
キーワード(3)(和/英) GPU / GPU
キーワード(4)(和/英) CUDA / CUDA
第 1 著者 氏名(和/英) 柄本 悠太郎 / Yutaro Emoto
第 1 著者 所属(和/英) 広島大学(略称:広島大)
Hiroshima University(略称:Hiroshima Univ.)
第 2 著者 氏名(和/英) 本田 巧 / Takumi Honda
第 2 著者 所属(和/英) 広島大学(略称:広島大)
Hiroshima University(略称:Hiroshima Univ.)
第 3 著者 氏名(和/英) 中野 浩嗣 / Koji Nakano
第 3 著者 所属(和/英) 広島大学(略称:広島大)
Hiroshima University(略称:Hiroshima Univ.)
第 4 著者 氏名(和/英) 伊藤 靖朗 / Yasuaki Ito
第 4 著者 所属(和/英) 広島大学(略称:広島大)
Hiroshima University(略称:Hiroshima Univ.)
発表年月日 2017-07-26
資料番号 CPSY2017-19
巻番号(vol) vol.117
号番号(no) CPSY-153
ページ範囲 pp.19-24(CPSY),
ページ数 6
発行日 2017-07-19 (CPSY)