講演名 2004/6/11
属性抽出に基づく結果解釈を目的としたクラスタリング手法の検討(一般セッション(1))(ITS・監視・セキュリティのためのパターン認識・メディア理解)
桑田 修平, 西村 正寿, 原 正巳, 松永 務,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 大規模データを扱うデータマイニングにおいては,分類結果を得るのみならず,得られたクラスタリング結果を解釈することが目指すものである.クラスタリングの結果得られた個々のクラスタを解釈することが必要であり,K平均法(K-means法)を代表とする従来手法を用いた場合には,分類を主眼に置いた手法であるため,クラスタリング結果を受けて推察することが要求される.本報告では,クラスタを特徴づける属性をクラスタリング結果から自動で抽出することによって,クラスタリング結果の解釈を容易にするクラスタリング手法を提案する.提案法は,クラスタの特徴を部分空間で記述して部分空間どうしの距離が最大となるようにクラスタリングを行った後に,得られた部分空間を用いてクラスタを特徴付ける属性を自動で抽出する方法である.実験によって本手法の有効性を示す.
抄録(英) When we treats the large-scale data which data mining makes the target, clustering which divides data into the similar group - cluster- serves as an effective means for the 1st phase of the process of data mining. It becomes important to not only obtain a result of an analysis, but to be possible to interpret the result. However, since the conventional clustering techniques, such as K-means method, does not explicitly intend to interpret the cluster result which obtained, it is required to guess from the cluster result to give an interpretation. Then, in this report, we propose the clustering method which makes the interpretation of a cluster result easily by extracting automatically the attributes using the subspace which the cluster is characterized. Our method, maximize the distance between any pair of subspaces which describe the feature of each clusters, and then extract automatically the attributes by which a cluster is characterized. We show the effectiveness of our method by experimental results.
キーワード(和) データマイニング / クラスタリング / 部分空間 / 属性抽出
キーワード(英) data mining / clustering / subspace / attribute extraction
資料番号 PRMU2004-35
発行日

研究会情報
研究会 PRMU
開催期間 2004/6/11(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Pattern Recognition and Media Understanding (PRMU)
本文の言語 JPN
タイトル(和) 属性抽出に基づく結果解釈を目的としたクラスタリング手法の検討(一般セッション(1))(ITS・監視・セキュリティのためのパターン認識・メディア理解)
サブタイトル(和)
タイトル(英) A Study on a Clustering Method for the Purpose of Interpreting the Result Based on Attribute Extraction
サブタイトル(和)
キーワード(1)(和/英) データマイニング / data mining
キーワード(2)(和/英) クラスタリング / clustering
キーワード(3)(和/英) 部分空間 / subspace
キーワード(4)(和/英) 属性抽出 / attribute extraction
第 1 著者 氏名(和/英) 桑田 修平 / Shuhei KUWATA
第 1 著者 所属(和/英) 株式会社NTTデータ技術開発本部
Research and Development Headquarters, NTT DATA CORPORATION
第 2 著者 氏名(和/英) 西村 正寿 / Masanobu NISHIMURA
第 2 著者 所属(和/英) 株式会社NTTデータ技術開発本部
Research and Development Headquarters, NTT DATA CORPORATION
第 3 著者 氏名(和/英) 原 正巳 / Masami HARA
第 3 著者 所属(和/英) 株式会社NTTデータ技術開発本部
Research and Development Headquarters, NTT DATA CORPORATION
第 4 著者 氏名(和/英) 松永 務 / Tsutomu MATSUNAGA
第 4 著者 所属(和/英) 株式会社NTTデータ技術開発本部
Research and Development Headquarters, NTT DATA CORPORATION
発表年月日 2004/6/11
資料番号 PRMU2004-35
巻番号(vol) vol.104
号番号(no) 125
ページ範囲 pp.-
ページ数 6
発行日