講演抄録/キーワード |
講演名 |
2006-07-14 09:30
Parameter Setting for a Clustering Method through an Analytical Study of Real Data ○Sophoin Khy(Univ. of Tsukuba)・Yoshiharu Ishikawa(Nagoya Univ.)・Hiroyuki Kitagawa(Univ. of Tsukuba) |
抄録 |
(和) |
これまで,我々のグループでは新規性に基づくクラスタリング法に関する研究を進めてきた.このクラスタリング手法では,最近のトピックの傾向を反映したクラスタリング結果を生成することを目的としている.このクラスタリング法の課題として,時間の経過につれて文書の価値がどの程度減少するかという指数的忘却係数をどのよ
うに設定するかという問題があった.これまでのアプローチでは,ユーザからただ一つの忘却パラメータが与えられ,どのようなカテゴリの文書についてもその一つの値が適用されていた.これに対し,この論文では実データをもとにした分析を行う.カテゴリのタイプに依存して,文書の忘却の仕方にどの程度違いがあるかを検証する. |
(英) |
In our previous papers, we have proposed a novelty-based document clustering method. The clustering method generates clusters reflecting current trend of recent topics. However, the problem with this clustering method is the setting of the exponential decaying factor parameter through which a document loses its value as time passes. In the clustering method, the parameter value is assumed a user-specified parameter and only one value is used for all types of documents regardless of which categories they are in. In this paper, we will show an analytical study on the real dataset. The objective of this study is to find the relationship between the decaying behavior of each document with their corresponding category types which will be helpful in the setting of parameter values in the novelty-based document clustering method. |
キーワード |
(和) |
クラスタリング / パラメータ設定 / 忘却係数 / 指数的忘却 / 実データ分析 / カテゴリ情報 / / |
(英) |
clustering / parameter setting / forgetting factor / exponential decay / real data analysis / Category information / / |
文献情報 |
信学技報, vol. 106, no. 150, DE2006-99, pp. 43-48, 2006年7月. |
資料番号 |
DE2006-99 |
発行日 |
2006-07-07 (DE) |
ISSN |
Print edition: ISSN 0913-5685 |
PDFダウンロード |
|