講演抄録/キーワード |
講演名 |
2008-02-01 13:50
確率的埋め込み法によるデータクラスタリング ○西川尚斗・土居伸二・熊谷貞俊(阪大) NLP2007-149 |
抄録 |
(和) |
確率的近接データ埋め込み法(SPE: Stochastic Proximity Embedding)は与えられたデータ間の類似度をもとに
データクラスタリングを行う手法の一つである.
SPEによるデータクラスタリング結果は,与える類似度に大きく依存するため,
類似度をどのように定義するのかが非常に重要な問題である.
本論文では,繰り返し学習によって自動的に類似度を最適化する方法を提案し,
その学習過程をSPEのアルゴリズムに導入することでSPEを拡張する.
いくつかのサンプルデータと高次元の実データについてデータクラスタリングを行い,拡張したSPEの有用性を評価する. |
(英) |
The stochastic proximity embedding (SPE) is one of the data clustering methods which use given similarity among input data.
The result of data clustering by the SPE depends on the definition of similarity.
In this paper, we propose a method which automatically optimizes the similarity for data clustering by an iterative learning and extend the SPE by applying the process of the iterative learning.
Using some low-dimensional artificial data and high-dimensional practical data, we demonstrate the effectiveness of the extended SPE. |
キーワード |
(和) |
データマイニング / データクラスタリング / 確率的近接データ埋め込み法 / / / / / |
(英) |
data mining / data clustering / stochastic proximity embedding (SPE) / / / / / |
文献情報 |
信学技報, vol. 107, no. 478, NLP2007-149, pp. 39-44, 2008年1月. |
資料番号 |
NLP2007-149 |
発行日 |
2008-01-25 (NLP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NLP2007-149 |