講演名 2006-07-14
一般化されたノイズ入りデータに対する相関ルールマイニング(マイニング)
成田 和世, 北川 博之,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 情報技術の発達に伴い,ディジタル情報は増加,多様化の一途を辿っている.それに伴い,巨大なデータから隠れた特徴や規則を体系的に発見するデータマイニングの技術は,ますます重要となっている.しかし,実世界に存在するデータは欠損値や誤った値などのノイズを含むものも多い.このようなノイズ入りデータからマイニングされる情報は不正確なものとなってしまう.先行研究[1]で,我々はあるトランザクションに本来出現するはずのアイテムがそのトランザクションから消失するノイズと,本来出現しないはずのアイテムがそのトランザクションに出現するノイズの,2種類のノイズを想定して,この2種類のノイズのみを含むデータベースから,ノイズのない真の状態のデータベースにおける頻出アイテム集合を推定する手法を提案した.しかし,実世界上のデータには,[1]が想定した2種類のノイズ以外のノイズを持つものも多く存在する.本稿では,[1]で提案した頻出アイテム集合の推定法を,より一般的なノイズ入りデータに対しても使用できるように一般化する.
抄録(英) As we face huge amounts of varied information, data mining, which helps us discover hidden features or rules from voluminous data systematically, has become more important. However, many data in real world are dirty, including noises such as missing values or irrelevant values. The information mined from such noisy data becomes incorrect. In our previous work [1], we assumed a noisy data model which involves two kinds of noise: one is that an item which should be in a transaction erronously disappears, and another that an item which should not be in a transaction erronously appears. We proposed the method to estimate frequent itemsets [2] on the noiseless data, by probabilistic calculation using the noisy one. However, the real world data may include more complex patterns of noises. In this paper, we present a more generalized noisy data model, and discuss association rule mining under the model.
キーワード(和) データマイニング / 相関ルールマイニング / 知識発見 / ノイズ入りデータモデル
キーワード(英) data mining / association rule mining / knowledge discovery / noisy data model
資料番号 DE2006-100
発行日

研究会情報
研究会 DE
開催期間 2006/7/7(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Data Engineering (DE)
本文の言語 JPN
タイトル(和) 一般化されたノイズ入りデータに対する相関ルールマイニング(マイニング)
サブタイトル(和)
タイトル(英) Association Rule Mining for a Generalized Noisy Data Model
サブタイトル(和)
キーワード(1)(和/英) データマイニング / data mining
キーワード(2)(和/英) 相関ルールマイニング / association rule mining
キーワード(3)(和/英) 知識発見 / knowledge discovery
キーワード(4)(和/英) ノイズ入りデータモデル / noisy data model
第 1 著者 氏名(和/英) 成田 和世 / Kazuyo NARITA
第 1 著者 所属(和/英) 筑波大学大学院システム情報工学研究科
Graduate School of Systems and Information Engineering, University of Tsukuba
第 2 著者 氏名(和/英) 北川 博之 / Hiroyuki KITAGAWA
第 2 著者 所属(和/英) 筑波大学大学院システム情報工学研究科
Graduate School of Systems and Information Engineering, University of Tsukuba
発表年月日 2006-07-14
資料番号 DE2006-100
巻番号(vol) vol.106
号番号(no) 150
ページ範囲 pp.-
ページ数 6
発行日