講演名 | 2018-07-31 並列プログラム自動生成におけるベクトル計算機向けメモリ参照効率化のための間接参照の削減 石田 祐二郎(阪大), 置田 真生(阪大), 萩原 兼一(阪大), 伊野 文彦(阪大), |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 大規模な数理モデルを入力として,そのシミュレーションを行うベクトル計算機向けプログラムを自動生成する.不規則な参照パターンを含む問題では,ループ単位のベクトル化において配列の間接参照が有用である.しかし,ベクトル化コンパイラはデータ配置に関わらず間接参照をギャザ・スキャタ命令に変換する.これはメモリ律速なプログラムでは性能ボトルネックとなり得る.そこで本報告では,プログラム生成時に参照パターンを分析し,冗長な間接参照を直接参照へ置換する手法を提案する.さらに,逐次参照が増大するようデータ配置を変更することで,直接参照で記述可能な参照パターンを増加する.SX-ACEを用いた実験の結果,3千万以上の数式を含む生体シミュレーションプログラムに対して最大1.4倍の性能向上を達成した. |
抄録(英) | We discuss automatic code generation of a vectorizable program from a large-scale mathematical model. Indirect addressing of array elements is useful to vectorize loops that include irregular memory access patterns. However, vectorizing compilers translate indirect addressing into gather/scatter instructions independent of data placement, resulting in a possible performance bottleneck for memory-intensive programs. In this report, we propose a method that replaces redundant indirect addressing with direct addressing by analyzing access patterns during code generation. Furthermore, out method increase access patterns to be writable in a direct addressing manner by enhancing sequential access. Experimental results on SX-ACE demonstrate that the proposed method accelerates a biophysical simulation program including more than 30 million equations by a factor of 1.4. |
キーワード(和) | SX-ACE / データ配置 / 自動ベクトル化 / DSL |
キーワード(英) | SX-ACE / Data placement / Auto-vectorization / DSL |
資料番号 | CPSY2018-20 |
発行日 | 2018-07-23 (CPSY) |
研究会情報 | |
研究会 | CPSY / DC / IPSJ-ARC |
---|---|
開催期間 | 2018/7/30(から3日開催) |
開催地(和) | 熊本市国際交流会館 |
開催地(英) | Kumamoto City International Center |
テーマ(和) | 並列/分散/協調システムとディペンダブルコンピューティングおよび一般 |
テーマ(英) | Parallel, Distributed and Cooperative Processing Systems and Dependable Computing |
委員長氏名(和) | 中野 浩嗣(広島大) / 福本 聡(首都大東京) / 五島 正裕(NII) |
委員長氏名(英) | Koji Nakano(Hiroshima Univ.) / Satoshi Fukumoto(Tokyo Metropolitan Univ.) / Masahiro Goshima(NII) |
副委員長氏名(和) | 入江 英嗣(東大) / 三吉 貴史(富士通研) / 高橋 寛(愛媛大) |
副委員長氏名(英) | Hidetsugu Irie(Univ. of Tokyo) / Takashi Miyoshi(Fujitsu) / Hiroshi Takahashi(Ehime Univ.) |
幹事氏名(和) | 大川 猛(宇都宮大) / 高前田 伸也(北大) / 金子 晴彦(東工大) / 新井 雅之(日大) / 小野 貴継(九大) / 近藤 正章(東大) / 長谷川 揚平(東芝) / 塩谷 亮太(名大) |
幹事氏名(英) | Takeshi Ohkawa(Utsunomiya Univ.) / Shinya Takameda(Hokkaido Univ.) / Haruhiko Kaneko(Tokyo Inst. of Tech.) / Masayuki Arai(Nihon Univ.) / Takatsugu Ono(Kyushu Univ.) / Masaaki Kondo(Univ. of Tokyo) / Yohei Hasegawa(Toshiba) / Ryota Shioya(Nagoya Univ.) |
幹事補佐氏名(和) | 伊藤 靖朗(広島大) / 津邑 公暁(名工大) |
幹事補佐氏名(英) | Yasuaki Ito(Hiroshima Univ.) / Tomoaki Tsumura(Nagoya Inst. of Tech.) |
講演論文情報詳細 | |
申込み研究会 | Technical Committee on Computer Systems / Technical Committee on Dependable Computing / Special Interest Group on System Architecture |
---|---|
本文の言語 | JPN |
タイトル(和) | 並列プログラム自動生成におけるベクトル計算機向けメモリ参照効率化のための間接参照の削減 |
サブタイトル(和) | |
タイトル(英) | Reduction of Indirect Addressing in Parallel-Program Generation for Improving Memory Efficiency on Vector Processor |
サブタイトル(和) | |
キーワード(1)(和/英) | SX-ACE / SX-ACE |
キーワード(2)(和/英) | データ配置 / Data placement |
キーワード(3)(和/英) | 自動ベクトル化 / Auto-vectorization |
キーワード(4)(和/英) | DSL / DSL |
第 1 著者 氏名(和/英) | 石田 祐二郎 / Yujiro Ishida |
第 1 著者 所属(和/英) | 大阪大学(略称:阪大) Osaka University(略称:Osaka Univ.) |
第 2 著者 氏名(和/英) | 置田 真生 / Masao Okita |
第 2 著者 所属(和/英) | 大阪大学(略称:阪大) Osaka University(略称:Osaka Univ.) |
第 3 著者 氏名(和/英) | 萩原 兼一 / Kenichi Hagihara |
第 3 著者 所属(和/英) | 大阪大学(略称:阪大) Osaka University(略称:Osaka Univ.) |
第 4 著者 氏名(和/英) | 伊野 文彦 / Fumihiko Ino |
第 4 著者 所属(和/英) | 大阪大学(略称:阪大) Osaka University(略称:Osaka Univ.) |
発表年月日 | 2018-07-31 |
資料番号 | CPSY2018-20 |
巻番号(vol) | vol.118 |
号番号(no) | CPSY-165 |
ページ範囲 | pp.115-120(CPSY), |
ページ数 | 6 |
発行日 | 2018-07-23 (CPSY) |