講演抄録/キーワード |
講演名 |
2004-10-15 11:00
Mining Frequent Trees with Node-Inclusion Constraints ○Atsuyoshi Nakamura・Mineichi Kudo(Hokkaido Univ.) |
抄録 |
(和) |
特殊節点を全て含む部分木で、頻出するものを効率的に数えあげる方法を提案する。提案アルゴリズムはZakiのTreeMinerアルゴリズムを、制約を満たすものだけ候補として効率的に生成するように改造したものである。また、同じラベルが多く存在する場合に大量のメモリを使用するという問題に対処する方法についても提案する。検索エンジンで集められたWebページに含まれる、レストランの名前と評判情報を含む頻出部分構造見つける問題に、提案アルゴリズムを適用することにより得られた結果につても報告する。 |
(英) |
In this paper, we propose an efficient algorithm enumerating all frequent subtrees containing all special nodes that are guaranteed to be included in all trees belonging to a given data. Our algorithm is a modification of TreeMiner algorithm proposed by Zaki so as to efficiently generate only candidate subtrees satisfying our constraints. We also propose a space saving method for a set of trees with a lot of nodes having the same label. We report mining results obtained by applying our algorithm to the problem of finding frequent structures containing the name and reputation of given restaurants in Web pages collected by a search engine. |
キーワード |
(和) |
頻出木 / 最小サポート / 制約 / Webマイニング / / / / |
(英) |
freequent tree / minimum support / constraint / Web mining / / / / |
文献情報 |
信学技報, vol. 104, no. 339, COMP2004-44, pp. 7-14, 2004年10月. |
資料番号 |
COMP2004-44 |
発行日 |
2004-10-07 (COMP) |
ISSN |
Print edition: ISSN 0913-5685 |
PDFダウンロード |
|