講演名 2004/7/7
木構造を用いた並列頻出パターンマイニングにおける動的負荷分散機構(セッション8B : データマイニング)(夏のデータベースワークショップ : DBWS2004)
プラムディオノ イコ, 喜連川 優,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 大規模データベースから頻出パターンを効率的に発掘するのに、データ特性への適応が課題とされてきた.PCクラスタ上にFP-growthを基にした並列マイニングアルゴリズムを開発した.FP-growthが使用するFP-treeというデータ構造は分割が困難とされており、ノード間の処理負荷の偏りが増大する.提案する並列アルゴリズムは新たに導入されるpath depthとよばれるパラメータによって処理負荷を予測する.path depthは頻出パターンになりうるFP-treeの枝の長さから計算できる.しかしpath depthによる負荷分散制御はデータ特性依存パラメータを用いるため、未知のデータに対して、最適な値の決定が困難であった.本発表では、そのパラメータをマイニング実行中に最適化できる手法を提案する.
抄録(英) Adaptability is a major challenge to efficiently mine frequent patterns from large scale databases. We develop FP-growth based parallel mining algorithms on a PC cluster. Since the FP-tree is a complex data structure, it is difficult to partition and also increases the processing skew among nodes. The parallel algorithm employs a parameter called "path-depth" to estimate the workload from the minimum length of the tree-branches that possibly become frequent. Since the path depth is a data dependent parameter, we develop adaptive approaches to dynamically adjust the parameter during the execution.
キーワード(和) 頻出パターンマイニング / 並列処理 / PCクラスタ / 負荷分散
キーワード(英) frequent pattern mining / parallel processing / PC cluster / load balancing
資料番号 DE2004-85
発行日

研究会情報
研究会 DE
開催期間 2004/7/7(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Data Engineering (DE)
本文の言語 JPN
タイトル(和) 木構造を用いた並列頻出パターンマイニングにおける動的負荷分散機構(セッション8B : データマイニング)(夏のデータベースワークショップ : DBWS2004)
サブタイトル(和)
タイトル(英) Adaptive Load Balancing on Tree Based Parallel Frequent Pattern Mining
サブタイトル(和)
キーワード(1)(和/英) 頻出パターンマイニング / frequent pattern mining
キーワード(2)(和/英) 並列処理 / parallel processing
キーワード(3)(和/英) PCクラスタ / PC cluster
キーワード(4)(和/英) 負荷分散 / load balancing
第 1 著者 氏名(和/英) プラムディオノ イコ / Iko PRAMUDIONO
第 1 著者 所属(和/英) 日本電信電話株式会社NTT情報流通プラットフォーム研究所
NTT Information Sharing Platform Laboratories, NTT Corporation
第 2 著者 氏名(和/英) 喜連川 優 / Masaru KITSUREGAWA
第 2 著者 所属(和/英) 東京大学生産技術研究所
Institute of Industrial Science, The University of Tokyo
発表年月日 2004/7/7
資料番号 DE2004-85
巻番号(vol) vol.104
号番号(no) 177
ページ範囲 pp.-
ページ数 6
発行日