お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2012-08-02 18:00
CUDA向けフレームワークOpenMPCに対する適切なメモリの自動選択による改良
内山寛章津邑公暁松尾啓志名工大CPSY2012-17
抄録 (和) GPU 向けのC 言語統合開発環境としてCUDA が開発されているが,CUDA を用いたプログラミングでは,GPU アーキテクチャやCUDA 特有の記述に関する知識が必要となり,プログラマにとって負担が大きい.これを軽減する為に,多くのCUDA 向けフレームワークが研究されており,その一つにOpenMPC がある.OpenMPCはプログラマにとって学習コストが小さいが,OpenMPC を用いて単純に変換しただけのプログラムでは,GPU 側のメモリの中から高速にアクセス可能なものを使用できない.また,OpenMPC ではデータを高速に転送可能なCPU側のメモリにデータを配置できない.そこで,OpenMPC を改良し,GPU 側の適切なメモリを自動的に選択し,使用する手法を提案する.さらに,GPU に転送されるデータを自動的に検出し、そのデータを高速に転送可能なメモリ領域に配置する手法も提案する.提案手法を実装したOpenMPC を複数のベンチマークを用いて評価したところ,最大で52%の実行時間削減を達成した. 
(英) The CUDA programming model provides better abstraction for GPU programming. However, it is still hard to build program because some specific techniques and knowledge about GPU architecture are required. Hence, many frameworks for CUDA have been developed. OpenMPC is one of them based on OpenMP. OpenMPC is an easy-to-write framework for programmers familiar with traditional OpenMP, but still requires programmers to use special directives for using fast device memories. To solve this problem, this paper propses a method for allocating data on appropriate device memories automatically. This paper also propses a method for allocating data, which are transferred between host and device, on page locked memory. The experiment results with several programs show that proposed methods can reduce 52% execution time in maximum.
キーワード (和) CUDA / 自動並列化 / / / / / /  
(英) CUDA / Auto parallelization / / / / / /  
文献情報 信学技報, vol. 112, no. 173, CPSY2012-17, pp. 49-54, 2012年8月.
資料番号 CPSY2012-17 
発行日 2012-07-26 (CPSY) 
ISSN Print edition: ISSN 0913-5685    Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード CPSY2012-17

研究会情報
研究会 DC CPSY  
開催期間 2012-08-02 - 2012-08-03 
開催地(和) とりぎん文化会館 
開催地(英) Torigin Bunka Kaikan 
テーマ(和) 2012年並列/分散/協調処理に関する『鳥取』サマー・ワークショップ(SWoPP鳥取2012) 
テーマ(英) Summer United Workshops on Parallel, Distributed and Cooperative Processing "Tottori" (SWoPP 2012) 
講演論文情報の詳細
申込み研究会 CPSY 
会議コード 2012-08-DC-CPSY 
本文の言語 日本語 
タイトル(和) CUDA向けフレームワークOpenMPCに対する適切なメモリの自動選択による改良 
サブタイトル(和)  
タイトル(英) An Automatic Device Memory Allocation Method for OpenMPC 
サブタイトル(英)  
キーワード(1)(和/英) CUDA / CUDA  
キーワード(2)(和/英) 自動並列化 / Auto parallelization  
キーワード(3)(和/英) /  
キーワード(4)(和/英) /  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 内山 寛章 / Hiroaki Uchiyama / ウチヤマ ヒロアキ
第1著者 所属(和/英) 名古屋工業大学 (略称: 名工大)
Nagoya Inst. of Tech. (略称: Nagoya Inst. of Tech.)
第2著者 氏名(和/英/ヨミ) 津邑 公暁 / Tomoaki Tsumura / ツムラ トモアキ
第2著者 所属(和/英) 名古屋工業大学 (略称: 名工大)
Nagoya Inst. of Tech. (略称: Nagoya Inst. of Tech.)
第3著者 氏名(和/英/ヨミ) 松尾 啓志 / Hiroshi Matsuo / マツオ ヒロシ
第3著者 所属(和/英) 名古屋工業大学 (略称: 名工大)
Nagoya Inst. of Tech. (略称: Nagoya Inst. of Tech.)
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2012-08-02 18:00:00 
発表時間 30分 
申込先研究会 CPSY 
資料番号 CPSY2012-17 
巻番号(vol) vol.112 
号番号(no) no.173 
ページ範囲 pp.49-54 
ページ数
発行日 2012-07-26 (CPSY) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会