講演名 2003/3/6
エピソードルールの近似的冗長性を考慮した効率的な時系列データセットマイニング(<特集>「アクティブマイニング」及び一般)
藤田 雄介, 原口 誠,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 時系列データセットからの相関ルールマイニングは,重要なデークマイニングのタスクとして考えられる.一般に,大規模データベースから抽出されるルールは膨大な数に及び,ユーザが全てのルールを検証,評価することは現実的に不可能な作業と言っても過言ではない.本稿では,時系列データセットより生成されるエピソードルールの大部分が冗長であることに着目し,ルールの近似的冗長性の概念に基づき,非冗長なエピソードルールのみを抽出する近似情報基生成手法を導入する.全ての冗長ルールが近似情報基から再構築可能である点で,生成ルール抑制による情報損失は無いと言える.計算機実験の結果により,本手法による抽出したエピソードルールの数が,既存の手法よりも大幅に減少したことを示す.
抄録(英) Discovery of association rules from time-series datasets is an important data mining task. Generally, the number of potential rules grows rapidly as the size of database increases. It is therefor hard for a user to analyze the rules and realize useful ones among them. To avoid such a difficulty, we make some rules invisible to users, provided they are redundant and approximately reconstructed from another non-redundant ones. In another words, only non-redundant rules are presented to users and will be checked for their interestingness. For this purpose, we first define a notion of approximate informative basis consisting of only non-redundant rules, and then present an efficient method to construct it. The degree of approximate reconstruction is associated with the basis as a real parameter adjustable by users. Our experimental results show that the number of non-redundant rules in the approximate informative basis is much reduced.
キーワード(和) 相関ルール発見 / 時系列データセット / イベント列 / エピソードルール / 近似的冗長性
キーワード(英) association rule mining / time-series dataset / vent sequence / episode rule / approximate redundancy
資料番号 AI2002-65
発行日

研究会情報
研究会 AI
開催期間 2003/3/6(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Artificial Intelligence and Knowledge-Based Processing (AI)
本文の言語 JPN
タイトル(和) エピソードルールの近似的冗長性を考慮した効率的な時系列データセットマイニング(<特集>「アクティブマイニング」及び一般)
サブタイトル(和)
タイトル(英) An Efficient Mining Method for Episode Rules using Approximate Informative Basis
サブタイトル(和)
キーワード(1)(和/英) 相関ルール発見 / association rule mining
キーワード(2)(和/英) 時系列データセット / time-series dataset
キーワード(3)(和/英) イベント列 / vent sequence
キーワード(4)(和/英) エピソードルール / episode rule
キーワード(5)(和/英) 近似的冗長性 / approximate redundancy
第 1 著者 氏名(和/英) 藤田 雄介 / Yusuke FUJITA
第 1 著者 所属(和/英) 北海道大学大学院工学研究科電子情報工学専攻
Division of Electronics and Information Engineering Hokkaido University
第 2 著者 氏名(和/英) 原口 誠 / Makoto HARAGUCHI
第 2 著者 所属(和/英) 北海道大学大学院工学研究科電子情報工学専攻
Division of Electronics and Information Engineering Hokkaido University
発表年月日 2003/3/6
資料番号 AI2002-65
巻番号(vol) vol.102
号番号(no) 709
ページ範囲 pp.-
ページ数 5
発行日