講演名 1999/1/23
並列SQLによる大規模PCクラスター上の相関ルールマイニング : C実装プログラムとの性能比較
プラムディオノ イコ, 新谷 隆彦, 田村 孝之, 喜連川 優,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 蓄積されたデータベースが大きくなるにしたがってそのデータベースから隠された付加価値を発掘するデータマイニングの重要性が広く認識されるようになった.現在のデータベースの主流は関係データベースシステムであるのでSQLを用いたデータマイニングの実現が広く望まれるが、SQLベースのデータマイニングは専用プログラムに比べて性能の面では劣ることが知られている.ここで大規模なPCクラスター上でSQLベースのデータマイニングの並列化の評価を報告する.通常の相関ルールマイニングでは4ノードを用いた並列化はC言語で書かれるプログラムと同等の性能を示し、階層関係を考慮した相関ルールマイニングの場合でも6-8ノードで互角の結果が得られることが分かる.
抄録(英) Data mining is becoming increasingly important since the size of databases grows even larger and the need to explore hidden rules from the databases become widely recognized.Currently database systems dominated by relational database and the ability to perform data mining using standard SQL query will definitely ease implementation of data mining.However SQL based data mining performance is known to fall behind specialized implementation.In this paper we presented an evaluation of data mining based on parallel SQL on large scale PC cluster. For flat association rule mining, parallelizing SQL query using 4 processing nodes the performance is even with C based program while in case of generalized association rule with taxonomy, we achieve comparable result with 6-8 processing nodes.
キーワード(和)
キーワード(英)
資料番号 DE98-56
発行日

研究会情報
研究会 DE
開催期間 1999/1/23(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Data Engineering (DE)
本文の言語 JPN
タイトル(和) 並列SQLによる大規模PCクラスター上の相関ルールマイニング : C実装プログラムとの性能比較
サブタイトル(和)
タイトル(英) Parallel SQL Based Association Rule Mining on Large Scale PC Cluster : Performance Comparison with Directly Coded C Implementation
サブタイトル(和)
キーワード(1)(和/英)
第 1 著者 氏名(和/英) プラムディオノ イコ / Iko Pramudiono
第 1 著者 所属(和/英) 東京大学生産技術研究所
Institute of Industrial Science, The University of Tokyo
第 2 著者 氏名(和/英) 新谷 隆彦 / Takahiko Shintani
第 2 著者 所属(和/英) 東京大学生産技術研究所
Institute of Industrial Science, The University of Tokyo
第 3 著者 氏名(和/英) 田村 孝之 / Takayuki Tamura
第 3 著者 所属(和/英) 東京大学生産技術研究所
Institute of Industrial Science, The University of Tokyo
第 4 著者 氏名(和/英) 喜連川 優 / Masaru Kitsuregawa
第 4 著者 所属(和/英) 東京大学生産技術研究所
Institute of Industrial Science, The University of Tokyo
発表年月日 1999/1/23
資料番号 DE98-56
巻番号(vol) vol.98
号番号(no) 561
ページ範囲 pp.-
ページ数 8
発行日