講演抄録/キーワード |
講演名 |
2018-07-31 14:30
並列プログラム自動生成におけるベクトル計算機向けメモリ参照効率化のための間接参照の削減 ○石田祐二郎・置田真生・萩原兼一・伊野文彦(阪大) CPSY2018-20 |
抄録 |
(和) |
大規模な数理モデルを入力として,そのシミュレーションを行うベクトル計算機向けプログラムを自動生成する.不規則な参照パターンを含む問題では,ループ単位のベクトル化において配列の間接参照が有用である.しかし,ベクトル化コンパイラはデータ配置に関わらず間接参照をギャザ・スキャタ命令に変換する.これはメモリ律速なプログラムでは性能ボトルネックとなり得る.そこで本報告では,プログラム生成時に参照パターンを分析し,冗長な間接参照を直接参照へ置換する手法を提案する.さらに,逐次参照が増大するようデータ配置を変更することで,直接参照で記述可能な参照パターンを増加する.SX-ACEを用いた実験の結果,3千万以上の数式を含む生体シミュレーションプログラムに対して最大1.4倍の性能向上を達成した. |
(英) |
We discuss automatic code generation of a vectorizable program from a large-scale mathematical model. Indirect addressing of array elements is useful to vectorize loops that include irregular memory access patterns. However, vectorizing compilers translate indirect addressing into gather/scatter instructions independent of data placement, resulting in a possible performance bottleneck for memory-intensive programs. In this report, we propose a method that replaces redundant indirect addressing with direct addressing by analyzing access patterns during code generation. Furthermore, out method increase access patterns to be writable in a direct addressing manner by enhancing sequential access. Experimental results on SX-ACE demonstrate that the proposed method accelerates a biophysical simulation program including more than 30 million equations by a factor of 1.4. |
キーワード |
(和) |
SX-ACE / データ配置 / 自動ベクトル化 / DSL / / / / |
(英) |
SX-ACE / Data placement / Auto-vectorization / DSL / / / / |
文献情報 |
信学技報, vol. 118, no. 165, CPSY2018-20, pp. 115-120, 2018年7月. |
資料番号 |
CPSY2018-20 |
発行日 |
2018-07-23 (CPSY) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
CPSY2018-20 |
研究会情報 |
研究会 |
CPSY DC IPSJ-ARC |
開催期間 |
2018-07-30 - 2018-08-01 |
開催地(和) |
熊本市国際交流会館 |
開催地(英) |
Kumamoto City International Center |
テーマ(和) |
並列/分散/協調システムとディペンダブルコンピューティングおよび一般 |
テーマ(英) |
Parallel, Distributed and Cooperative Processing Systems and Dependable Computing |
講演論文情報の詳細 |
申込み研究会 |
CPSY |
会議コード |
2018-07-CPSY-DC-ARC |
本文の言語 |
日本語 |
タイトル(和) |
並列プログラム自動生成におけるベクトル計算機向けメモリ参照効率化のための間接参照の削減 |
サブタイトル(和) |
|
タイトル(英) |
Reduction of Indirect Addressing in Parallel-Program Generation for Improving Memory Efficiency on Vector Processor |
サブタイトル(英) |
|
キーワード(1)(和/英) |
SX-ACE / SX-ACE |
キーワード(2)(和/英) |
データ配置 / Data placement |
キーワード(3)(和/英) |
自動ベクトル化 / Auto-vectorization |
キーワード(4)(和/英) |
DSL / DSL |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
石田 祐二郎 / Yujiro Ishida / |
第1著者 所属(和/英) |
大阪大学 (略称: 阪大)
Osaka University (略称: Osaka Univ.) |
第2著者 氏名(和/英/ヨミ) |
置田 真生 / Masao Okita / |
第2著者 所属(和/英) |
大阪大学 (略称: 阪大)
Osaka University (略称: Osaka Univ.) |
第3著者 氏名(和/英/ヨミ) |
萩原 兼一 / Kenichi Hagihara / |
第3著者 所属(和/英) |
大阪大学 (略称: 阪大)
Osaka University (略称: Osaka Univ.) |
第4著者 氏名(和/英/ヨミ) |
伊野 文彦 / Fumihiko Ino / |
第4著者 所属(和/英) |
大阪大学 (略称: 阪大)
Osaka University (略称: Osaka Univ.) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2018-07-31 14:30:00 |
発表時間 |
30分 |
申込先研究会 |
CPSY |
資料番号 |
CPSY2018-20 |
巻番号(vol) |
vol.118 |
号番号(no) |
no.165 |
ページ範囲 |
pp.115-120 |
ページ数 |
6 |
発行日 |
2018-07-23 (CPSY) |