講演名 | 2005-07-13 クラスタ粒度階層構造を用いたアウトライヤー文書の検出手法(文書検索, 夏のデータベースワークショップ2005) 青野 雅樹, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 大規模な文書から、稀少な分布を有する文書(アウトライヤー文書)を検出する手法を述べる。本報告では, 文書データモデルとしてはベクトル空間モデルを用い, その後、前処理として「共クラスタリング」(Co-clustering)を複数回, 異なるクラスタ粒度で実行する。これより「クラスタ粒度階層構造」を構築し、このクラスタ粒度階層構造を用いてアウトライヤーを検出する手法を述べる。同時に従来法との比較実験をあわせて報告する. |
抄録(英) | Outlier detection is an important application in data mining community. We present an algorithm to generate a hierarchy of clusters for detecting "outlier" documents using the hierarchy. We also describe a comparative study of our proposed method with previously known methods. |
キーワード(和) | アウトライヤー / 共クラスタリング / クラスタ階層構造 |
キーワード(英) | Outlier detection / Co-clustering / Cluster hierarchy |
資料番号 | DE2005-30 |
発行日 |
研究会情報 | |
研究会 | DE |
---|---|
開催期間 | 2005/7/6(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Data Engineering (DE) |
---|---|
本文の言語 | JPN |
タイトル(和) | クラスタ粒度階層構造を用いたアウトライヤー文書の検出手法(文書検索, 夏のデータベースワークショップ2005) |
サブタイトル(和) | |
タイトル(英) | A Method for Detecting Outlier Documents Using a Hierarchy of Clusters |
サブタイトル(和) | |
キーワード(1)(和/英) | アウトライヤー / Outlier detection |
キーワード(2)(和/英) | 共クラスタリング / Co-clustering |
キーワード(3)(和/英) | クラスタ階層構造 / Cluster hierarchy |
第 1 著者 氏名(和/英) | 青野 雅樹 / Masaki AONO |
第 1 著者 所属(和/英) | 豊橋技術科学大学情報工学系 Information of Computer Sciences Department, Toyohashi University of Technology |
発表年月日 | 2005-07-13 |
資料番号 | DE2005-30 |
巻番号(vol) | vol.105 |
号番号(no) | 171 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |