講演名 | 2006-07-14 一般化されたノイズ入りデータに対する相関ルールマイニング(マイニング) 成田 和世, 北川 博之, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 情報技術の発達に伴い,ディジタル情報は増加,多様化の一途を辿っている.それに伴い,巨大なデータから隠れた特徴や規則を体系的に発見するデータマイニングの技術は,ますます重要となっている.しかし,実世界に存在するデータは欠損値や誤った値などのノイズを含むものも多い.このようなノイズ入りデータからマイニングされる情報は不正確なものとなってしまう.先行研究[1]で,我々はあるトランザクションに本来出現するはずのアイテムがそのトランザクションから消失するノイズと,本来出現しないはずのアイテムがそのトランザクションに出現するノイズの,2種類のノイズを想定して,この2種類のノイズのみを含むデータベースから,ノイズのない真の状態のデータベースにおける頻出アイテム集合を推定する手法を提案した.しかし,実世界上のデータには,[1]が想定した2種類のノイズ以外のノイズを持つものも多く存在する.本稿では,[1]で提案した頻出アイテム集合の推定法を,より一般的なノイズ入りデータに対しても使用できるように一般化する. |
抄録(英) | As we face huge amounts of varied information, data mining, which helps us discover hidden features or rules from voluminous data systematically, has become more important. However, many data in real world are dirty, including noises such as missing values or irrelevant values. The information mined from such noisy data becomes incorrect. In our previous work [1], we assumed a noisy data model which involves two kinds of noise: one is that an item which should be in a transaction erronously disappears, and another that an item which should not be in a transaction erronously appears. We proposed the method to estimate frequent itemsets [2] on the noiseless data, by probabilistic calculation using the noisy one. However, the real world data may include more complex patterns of noises. In this paper, we present a more generalized noisy data model, and discuss association rule mining under the model. |
キーワード(和) | データマイニング / 相関ルールマイニング / 知識発見 / ノイズ入りデータモデル |
キーワード(英) | data mining / association rule mining / knowledge discovery / noisy data model |
資料番号 | DE2006-100 |
発行日 |
研究会情報 | |
研究会 | DE |
---|---|
開催期間 | 2006/7/7(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Data Engineering (DE) |
---|---|
本文の言語 | JPN |
タイトル(和) | 一般化されたノイズ入りデータに対する相関ルールマイニング(マイニング) |
サブタイトル(和) | |
タイトル(英) | Association Rule Mining for a Generalized Noisy Data Model |
サブタイトル(和) | |
キーワード(1)(和/英) | データマイニング / data mining |
キーワード(2)(和/英) | 相関ルールマイニング / association rule mining |
キーワード(3)(和/英) | 知識発見 / knowledge discovery |
キーワード(4)(和/英) | ノイズ入りデータモデル / noisy data model |
第 1 著者 氏名(和/英) | 成田 和世 / Kazuyo NARITA |
第 1 著者 所属(和/英) | 筑波大学大学院システム情報工学研究科 Graduate School of Systems and Information Engineering, University of Tsukuba |
第 2 著者 氏名(和/英) | 北川 博之 / Hiroyuki KITAGAWA |
第 2 著者 所属(和/英) | 筑波大学大学院システム情報工学研究科 Graduate School of Systems and Information Engineering, University of Tsukuba |
発表年月日 | 2006-07-14 |
資料番号 | DE2006-100 |
巻番号(vol) | vol.106 |
号番号(no) | 150 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |