講演名 2002/10/10
滑走窓や忘却の概念を用いたオンライン型半構造データマイニングアルゴリズム
浅井 達哉, 有村 博紀, 安部 賢治, 川副 真治, 有川 節夫,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿では,半構造データのストリームに対するオンライン型データマイニング問題を考察する.我々は,半構造データとパターンのモデルとしてラベルつき順序木を採用し,与えられた半構造データストリームから,任意の時点で現在の頻出パターンを出力するオンライン型半構造データマイニングアルゴリズムStreamTを開発した.このアルゴリズムでは,掃木枝を右へ動かすことによりパターンの出現を漸増的に検知する.我々は,アルゴリズムが無限のデータストリームに対して,有限の資源しか用いずに効率的に働くことを示した.
抄録(英) In this paper, we study an online data mining problem from streams of semi-structured data such as XML data. Modeling semi-structured data and patterns as labeled ordered trees, we present an online algorithm StreamT that receives fragments of an unseen possibly infinite semi-structured data in the document order through a data stream, and can return the current set of frequent patterns immediately on request at any time. A crucial part of our algorithm is the incremental maintenance of the occurrences of possibly frequent patterns using a tree sweeping technique. We give modifications of the algorithm to other online mining models. We present theoretical and empirical analyses to evaluate the performance of the algorithm.
キーワード(和) 半構造データマイニング / データストリーム / 頻出パターン発見 / オンライン型マイニングアルゴリズム
キーワード(英) semi-structured data mining / data stream / frequent pattern discovery / online mining algorithm
資料番号 DC2002-24
発行日

研究会情報
研究会 DC
開催期間 2002/10/10(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Dependable Computing (DC)
本文の言語 JPN
タイトル(和) 滑走窓や忘却の概念を用いたオンライン型半構造データマイニングアルゴリズム
サブタイトル(和)
タイトル(英) Online Algorithms for Mining Semi-structured Data Stream with Sliding Window and Forgetting Factor
サブタイトル(和)
キーワード(1)(和/英) 半構造データマイニング / semi-structured data mining
キーワード(2)(和/英) データストリーム / data stream
キーワード(3)(和/英) 頻出パターン発見 / frequent pattern discovery
キーワード(4)(和/英) オンライン型マイニングアルゴリズム / online mining algorithm
第 1 著者 氏名(和/英) 浅井 達哉 / Tatsuya ASAI
第 1 著者 所属(和/英) 九州大学大学院システム情報科学府・研究院
Department of Informatics, Kyushu University
第 2 著者 氏名(和/英) 有村 博紀 / Hiroki ARIMURA
第 2 著者 所属(和/英) 九州大学大学院システム情報科学府・研究院:さきがけ研究21
Department of Informatics, Kyushu University:PRESTO, JST
第 3 著者 氏名(和/英) 安部 賢治 / Kenji ABE
第 3 著者 所属(和/英) 九州大学大学院システム情報科学府・研究院
Department of Informatics, Kyushu University
第 4 著者 氏名(和/英) 川副 真治 / Shinji KAWASOE
第 4 著者 所属(和/英) 九州大学大学院システム情報科学府・研究院
Department of Informatics, Kyushu University
第 5 著者 氏名(和/英) 有川 節夫 / Setsuo ARIKAWA
第 5 著者 所属(和/英) 九州大学大学院システム情報科学府・研究院
Department of Informatics, Kyushu University
発表年月日 2002/10/10
資料番号 DC2002-24
巻番号(vol) vol.102
号番号(no) 377
ページ範囲 pp.-
ページ数 6
発行日