お知らせ 研究会の開催と会場に参加される皆様へのお願い(2020年10月開催~)
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2017-11-19 15:00
[ポスター講演]単一カーネル同期テクニックを用いたGPUアプリケーション
船坂峻慈中野浩嗣伊藤靖朗広島大CPSY2017-56
抄録 (和) タスクアレイとは依存関係を持った2次元のタスクの配列である.
各タスクの計算のために, 既存のCUDA実装ではCUDAカーネルを分割し繰り返し呼び出すことによってタスクごとの同期をとっていた.
本研究では, 単一カーネル同期テクニックを用いて, CUDAカーネルを分割することなく実装するテクニックを提案する.
このテクニックのパフォーマンスを示すために, 0-1 ナップサック問題の動的計画法とサムドエリアテーブル計算とerror diffusionをSKSSテクニックを用いた実装を行いNVIDIA Titan Xを用いて実行時間を計測した.
既存の最速の実装と比較して, SKSS実装は, 0-1 ナップサック問題で1.29-2.11倍, サムドエリアテーブル計算で1.08-1.56倍, error diffusionで1.61-2.11倍の高速化を達成した. 
(英) A task array is a 2-dimensional array of tasks with dependency relations.
Conventional CUDA implementations repeatedly perform a separated CUDA kernel
call to synchronize the computation for tasks.
The main contribution of this paper is to introduce task arrays and to present Single Kernel Soft Synchronization (SKSS) technique
that significantly reduces the overheads of conventional implementation for task arrays.
To clarify the potentiality of our SKSS technique, we have implemented the dynamic programming for the 0-1 knapsack problem,
the summed area table computation, and the error diffusion using our SKSS technique
and compared with previously published best GPU implementations.
Quite surprisingly, the experimental results using NVIDIA Titan X show that, our SKSS implementations are 1.29-2.11 times faster for the 0-1 knapsack problem,
1.08-1.56 times faster for the summed area table computation, and 1.61-2.11 times faster for the error diffusion.
キーワード (和) 並列アルゴリズム / GPGPU / 動的計画法 / / / / /  
(英) parallel algorithms / GPGPU / Dynamic programming / / / / /  
文献情報 信学技報, vol. 117, no. 314, CPSY2017-56, pp. 33-38, 2017年11月.
資料番号 CPSY2017-56 
発行日 2017-11-12 (CPSY) 
ISSN Print edition: ISSN 0913-5685  Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード CPSY2017-56

研究会情報
研究会 CPSY  
開催期間 2017-11-19 - 2017-11-19 
開催地(和) 青森県観光物産館アスパム 
開催地(英) Aomori Tourist Information Center, ASPAM 
テーマ(和) 萌芽的コンピュータシステム研究展示会 
テーマ(英) Emerging Computer Systems Exhibition 
講演論文情報の詳細
申込み研究会 CPSY 
会議コード 2017-11-CPSY 
本文の言語 日本語 
タイトル(和) 単一カーネル同期テクニックを用いたGPUアプリケーション 
サブタイトル(和)  
タイトル(英) GPU Applications with Single Kernel Synchronization Technique 
サブタイトル(英)  
キーワード(1)(和/英) 並列アルゴリズム / parallel algorithms  
キーワード(2)(和/英) GPGPU / GPGPU  
キーワード(3)(和/英) 動的計画法 / Dynamic programming  
キーワード(4)(和/英) /  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 船坂 峻慈 / Shunji Funasaka / フナサカ シュンジ
第1著者 所属(和/英) 広島大学 (略称: 広島大)
Hiroshima University (略称: Hiroshima Univ.)
第2著者 氏名(和/英/ヨミ) 中野 浩嗣 / Koji Nakano / ナカノ コウジ
第2著者 所属(和/英) 広島大学 (略称: 広島大)
Hiroshima University (略称: Hiroshima Univ.)
第3著者 氏名(和/英/ヨミ) 伊藤 靖朗 / Yasuaki Ito / イトウ ヤスアキ
第3著者 所属(和/英) 広島大学 (略称: 広島大)
Hiroshima University (略称: Hiroshima Univ.)
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者
発表日時 2017-11-19 15:00:00 
発表時間 120 
申込先研究会 CPSY 
資料番号 IEICE-CPSY2017-56 
巻番号(vol) IEICE-117 
号番号(no) no.314 
ページ範囲 pp.33-38 
ページ数 IEICE-6 
発行日 IEICE-CPSY-2017-11-12 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会