大会名称
2009年 情報科学技術フォーラム(FIT)
大会コ-ド
F
開催年
2009
発行日
2009/8/20
セッション番号
7D
セッション名
データおよびWebマイニング
講演日
2009/09/04
講演場所(会議室等)
D会場(9号館1F 914教室)
講演番号
D-031
タイトル
頻出パタン抽出アルゴリズム「LCM over ZDDs」の変数順序付けの影響に関する考察
著者名
岡崎 佑太湊 真一
キーワード
データマイニング, 頻出アイテム集合, BDD, ZDD, 二分決定グラフ
抄録
近年、高速ネットワークの普及や記憶装置の大容量化が進み、大規模なデータベース
を扱う機会が急速に増えつつある。こうした背景の中で、「ゼロサプレス型二分決定
グラフ(ZDD: Zero-suppressed Binary Data Diagrams)」と呼ばれるコンパクトな表
現方法を用いて、効率良く頻出パタンを抽出する「LCM over ZDDs」アルゴリズムが
最近提案されている。「LCM over ZDDs」は出力サイズに対し線形時間で頻出パタン
を列挙できるが、生成されるZDDのサイズは変数順序によって大きく変化することが
知られている。そこで本研究では、変数順序によるZDDのサイズへの影響と、効果的
な変数順序付け法について実験と考察を行った。
本文pdf
PDF download (110.4KB)