大会名称 |
---|
2009年 情報科学技術フォーラム(FIT) |
大会コ-ド |
F |
開催年 |
2009 |
発行日 |
2009/8/20 |
セッション番号 |
7D |
セッション名 |
データおよびWebマイニング |
講演日 |
2009/09/04 |
講演場所(会議室等) |
D会場(9号館1F 914教室) |
講演番号 |
D-031 |
タイトル |
頻出パタン抽出アルゴリズム「LCM over ZDDs」の変数順序付けの影響に関する考察 |
著者名 |
岡崎 佑太, 湊 真一, |
キーワード |
データマイニング, 頻出アイテム集合, BDD, ZDD, 二分決定グラフ |
抄録 |
近年、高速ネットワークの普及や記憶装置の大容量化が進み、大規模なデータベース を扱う機会が急速に増えつつある。こうした背景の中で、「ゼロサプレス型二分決定 グラフ(ZDD: Zero-suppressed Binary Data Diagrams)」と呼ばれるコンパクトな表 現方法を用いて、効率良く頻出パタンを抽出する「LCM over ZDDs」アルゴリズムが 最近提案されている。「LCM over ZDDs」は出力サイズに対し線形時間で頻出パタン を列挙できるが、生成されるZDDのサイズは変数順序によって大きく変化することが 知られている。そこで本研究では、変数順序によるZDDのサイズへの影響と、効果的 な変数順序付け法について実験と考察を行った。 |
本文pdf |
PDF download (110.4KB) |