講演名 | 2004/7/7 木構造を用いた並列頻出パターンマイニングにおける動的負荷分散機構(セッション8B : データマイニング)(夏のデータベースワークショップ : DBWS2004) プラムディオノ イコ, 喜連川 優, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 大規模データベースから頻出パターンを効率的に発掘するのに、データ特性への適応が課題とされてきた.PCクラスタ上にFP-growthを基にした並列マイニングアルゴリズムを開発した.FP-growthが使用するFP-treeというデータ構造は分割が困難とされており、ノード間の処理負荷の偏りが増大する.提案する並列アルゴリズムは新たに導入されるpath depthとよばれるパラメータによって処理負荷を予測する.path depthは頻出パターンになりうるFP-treeの枝の長さから計算できる.しかしpath depthによる負荷分散制御はデータ特性依存パラメータを用いるため、未知のデータに対して、最適な値の決定が困難であった.本発表では、そのパラメータをマイニング実行中に最適化できる手法を提案する. |
抄録(英) | Adaptability is a major challenge to efficiently mine frequent patterns from large scale databases. We develop FP-growth based parallel mining algorithms on a PC cluster. Since the FP-tree is a complex data structure, it is difficult to partition and also increases the processing skew among nodes. The parallel algorithm employs a parameter called "path-depth" to estimate the workload from the minimum length of the tree-branches that possibly become frequent. Since the path depth is a data dependent parameter, we develop adaptive approaches to dynamically adjust the parameter during the execution. |
キーワード(和) | 頻出パターンマイニング / 並列処理 / PCクラスタ / 負荷分散 |
キーワード(英) | frequent pattern mining / parallel processing / PC cluster / load balancing |
資料番号 | DE2004-85 |
発行日 |
研究会情報 | |
研究会 | DE |
---|---|
開催期間 | 2004/7/7(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Data Engineering (DE) |
---|---|
本文の言語 | JPN |
タイトル(和) | 木構造を用いた並列頻出パターンマイニングにおける動的負荷分散機構(セッション8B : データマイニング)(夏のデータベースワークショップ : DBWS2004) |
サブタイトル(和) | |
タイトル(英) | Adaptive Load Balancing on Tree Based Parallel Frequent Pattern Mining |
サブタイトル(和) | |
キーワード(1)(和/英) | 頻出パターンマイニング / frequent pattern mining |
キーワード(2)(和/英) | 並列処理 / parallel processing |
キーワード(3)(和/英) | PCクラスタ / PC cluster |
キーワード(4)(和/英) | 負荷分散 / load balancing |
第 1 著者 氏名(和/英) | プラムディオノ イコ / Iko PRAMUDIONO |
第 1 著者 所属(和/英) | 日本電信電話株式会社NTT情報流通プラットフォーム研究所 NTT Information Sharing Platform Laboratories, NTT Corporation |
第 2 著者 氏名(和/英) | 喜連川 優 / Masaru KITSUREGAWA |
第 2 著者 所属(和/英) | 東京大学生産技術研究所 Institute of Industrial Science, The University of Tokyo |
発表年月日 | 2004/7/7 |
資料番号 | DE2004-85 |
巻番号(vol) | vol.104 |
号番号(no) | 177 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |