講演名 2016-09-13
MapReduceにおけるShuffleの性能解析
大黒 晴之(筑波大), 川島 英之(筑波大), 建部 修見(筑波大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本研究ではMapReduceにおけるshuffleの性能に関して,ネットワークI/OとディスクI/Oの2つの観点から詳細な解析を行う.解析対象として現在一般に幅広く用いられているin-memory MapReduce処理系であるApache Sparkを採用し,Spark 1.6.2の提供する2種類のshuffle実装 (Sort-based Shuffle, Hash-based Shuffle) に関して性能検証及び比較を行う.検証の結果,ネットワークI/Oに関しては2つのshuffle実装の間で大きな差は見られず,ディスクI/Oに関してはHash-based Shuffleの方が頻繁にディスクへのアクセスを行っているものの,最終的な実行時間に関してはHash-based Shuffleの方がSort-based Shuffleに対して有利になるという結果となった.
抄録(英) This paper analyzes shuffling performance of Apache Spark, which is one of the most popular MapReduce implementations in recent years. The performance of Sort-based Shuffle and Hash-based Shuffle, which are the two shuffle implementations provided by Spark 1.6.2, are evaluated and compared in terms of network I/O and disk I/O. The evaluation results showed that, while there was little difference between those two implementations in regards to network I/O, and more frequent disk I/O operations were confirmed on Hash-based implementation compared to Sort-based implementation, Hash-based Shuffle showed better performance than Sort-based Shuffle in terms of the overall execution time.
キーワード(和) MapReduce / Shuffle / Apache Spark / 性能解析
キーワード(英) MapReduce / Shuffle / Apache Spark / Performance Analysis
資料番号 DE2016-15
発行日 2016-09-06 (DE)

研究会情報
研究会 DE
開催期間 2016/9/13(から3日開催)
開催地(和) 慶応大学日吉キャンパス
開催地(英) Keio Univ. (Hiyoshi Campus)
テーマ(和) ビッグデータを対象とした管理・情報検索・知識獲得,および一般
テーマ(英) Big Data Management, Information Retrieval, Knowledge Discovery, etc.
委員長氏名(和) 小口 正人(お茶の水女子大)
委員長氏名(英) Masato Oguchi(Ochanomizu Univ.)
副委員長氏名(和) 鬼塚 真(阪大) / 豊田 正史(東大)
副委員長氏名(英) Makoto Onizuka(Osaka Univ.) / Masashi Toyoda(Univ. of Tokyo)
幹事氏名(和) 牛尼 剛聡(九大) / 北山 大輔(工学院大)
幹事氏名(英) Taketoshi Ushiama(Kyushu Univ.) / Daisuke Kitayama(Kogakuin Univ.)
幹事補佐氏名(和) 上田 真由美(流通科学大) / 大塚 真吾(神奈川工科大)
幹事補佐氏名(英) Mayuki Ueda(Univ. of Marketing and Distrbution Science) / Shingo Otsuka(Kanagawa Inst. of Tech.)

講演論文情報詳細
申込み研究会 Technical Committee on Data Engineering
本文の言語 JPN
タイトル(和) MapReduceにおけるShuffleの性能解析
サブタイトル(和)
タイトル(英) Performance Analysis of MapReduce Shuffling
サブタイトル(和)
キーワード(1)(和/英) MapReduce / MapReduce
キーワード(2)(和/英) Shuffle / Shuffle
キーワード(3)(和/英) Apache Spark / Apache Spark
キーワード(4)(和/英) 性能解析 / Performance Analysis
第 1 著者 氏名(和/英) 大黒 晴之 / Harunobu Daikoku
第 1 著者 所属(和/英) 筑波大学(略称:筑波大)
University of Tsukuba(略称:Univ. Tsukuba)
第 2 著者 氏名(和/英) 川島 英之 / Hideyuki Kawashima
第 2 著者 所属(和/英) 筑波大学(略称:筑波大)
University of Tsukuba(略称:Univ. Tsukuba)
第 3 著者 氏名(和/英) 建部 修見 / Osamu Tatebe
第 3 著者 所属(和/英) 筑波大学(略称:筑波大)
University of Tsukuba(略称:Univ. Tsukuba)
発表年月日 2016-09-13
資料番号 DE2016-15
巻番号(vol) vol.116
号番号(no) DE-214
ページ範囲 pp.19-24(DE),
ページ数 6
発行日 2016-09-06 (DE)