講演名 | 2002/10/10 滑走窓や忘却の概念を用いたオンライン型半構造データマイニングアルゴリズム 浅井 達哉, 有村 博紀, 安部 賢治, 川副 真治, 有川 節夫, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 本稿では,半構造データのストリームに対するオンライン型データマイニング問題を考察する.我々は,半構造データとパターンのモデルとしてラベルつき順序木を採用し,与えられた半構造データストリームから,任意の時点で現在の頻出パターンを出力するオンライン型半構造データマイニングアルゴリズムStreamTを開発した.このアルゴリズムでは,掃木枝を右へ動かすことによりパターンの出現を漸増的に検知する.我々は,アルゴリズムが無限のデータストリームに対して,有限の資源しか用いずに効率的に働くことを示した. |
抄録(英) | In this paper, we study an online data mining problem from streams of semi-structured data such as XML data. Modeling semi-structured data and patterns as labeled ordered trees, we present an online algorithm StreamT that receives fragments of an unseen possibly infinite semi-structured data in the document order through a data stream, and can return the current set of frequent patterns immediately on request at any time. A crucial part of our algorithm is the incremental maintenance of the occurrences of possibly frequent patterns using a tree sweeping technique. We give modifications of the algorithm to other online mining models. We present theoretical and empirical analyses to evaluate the performance of the algorithm. |
キーワード(和) | 半構造データマイニング / データストリーム / 頻出パターン発見 / オンライン型マイニングアルゴリズム |
キーワード(英) | semi-structured data mining / data stream / frequent pattern discovery / online mining algorithm |
資料番号 | DC2002-24 |
発行日 |
研究会情報 | |
研究会 | DC |
---|---|
開催期間 | 2002/10/10(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Dependable Computing (DC) |
---|---|
本文の言語 | JPN |
タイトル(和) | 滑走窓や忘却の概念を用いたオンライン型半構造データマイニングアルゴリズム |
サブタイトル(和) | |
タイトル(英) | Online Algorithms for Mining Semi-structured Data Stream with Sliding Window and Forgetting Factor |
サブタイトル(和) | |
キーワード(1)(和/英) | 半構造データマイニング / semi-structured data mining |
キーワード(2)(和/英) | データストリーム / data stream |
キーワード(3)(和/英) | 頻出パターン発見 / frequent pattern discovery |
キーワード(4)(和/英) | オンライン型マイニングアルゴリズム / online mining algorithm |
第 1 著者 氏名(和/英) | 浅井 達哉 / Tatsuya ASAI |
第 1 著者 所属(和/英) | 九州大学大学院システム情報科学府・研究院 Department of Informatics, Kyushu University |
第 2 著者 氏名(和/英) | 有村 博紀 / Hiroki ARIMURA |
第 2 著者 所属(和/英) | 九州大学大学院システム情報科学府・研究院:さきがけ研究21 Department of Informatics, Kyushu University:PRESTO, JST |
第 3 著者 氏名(和/英) | 安部 賢治 / Kenji ABE |
第 3 著者 所属(和/英) | 九州大学大学院システム情報科学府・研究院 Department of Informatics, Kyushu University |
第 4 著者 氏名(和/英) | 川副 真治 / Shinji KAWASOE |
第 4 著者 所属(和/英) | 九州大学大学院システム情報科学府・研究院 Department of Informatics, Kyushu University |
第 5 著者 氏名(和/英) | 有川 節夫 / Setsuo ARIKAWA |
第 5 著者 所属(和/英) | 九州大学大学院システム情報科学府・研究院 Department of Informatics, Kyushu University |
発表年月日 | 2002/10/10 |
資料番号 | DC2002-24 |
巻番号(vol) | vol.102 |
号番号(no) | 377 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |