講演名 2002/7/11
リンク・コンテンツ統合ウェブページクラスタリング手法の効果の検証
王 軟トン, 喜連川 優,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 近年クラスタリングはウェブ上における莫大な量の情報を処理(例えば、リソース探索や情報解釈)するための最も重要な手法の一つとなっている。本論文では、リンク情報とコンテンツを統合することによって、クエリートピックにおける検索結果をクラスタリングすることを可能にした新しい手法であるリンク・コンテンツ統合クラスタリング手法を提案し、本手法の質を検証した。種々の実験を行った結果、本手法によって、検索結果が返す莫大な量のウェブページを簡潔な階層構造による高クオリティーでセマンティックに意味のあるグループに分類し、また、そのグループに関するトピック名と共に提示できることを確認した。本論文では、これらの実験を通して得られた結果を提示し本手法が非常に効果的で有望であるということを示す。
抄録(英) Clustering is currently one of the most crucial techniques for dealing (e.g. resources locating, information interpreting) with massive amount of heterogeneous information on the web. In this paper, we present a unifying clustering algorithm to cluster web search results for a specific query topic by combining link and contents information. In particular, we examine the quality of the proposed link-contents coupled clustering approach. The proposed approach automatically clusters the web search results into high quality, semantically meaningful groups in a concise, easy-to-interpret hierarchy with tagging terms. We conduct experiments and comparisons and the experimental results show that the proposed approach is effective and promising.
キーワード(和)
キーワード(英) co-citation / coupling / anchor window / snippet
資料番号 DE2002-52
発行日

研究会情報
研究会 DE
開催期間 2002/7/11(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Data Engineering (DE)
本文の言語 ENG
タイトル(和) リンク・コンテンツ統合ウェブページクラスタリング手法の効果の検証
サブタイトル(和)
タイトル(英) Examining the Quality of Link-Contents Coupled Clustering for Web Pages
サブタイトル(和)
キーワード(1)(和/英) / co-citation
第 1 著者 氏名(和/英) 王 軟トン / Yitong Wang
第 1 著者 所属(和/英) 東京生産技術研究所
Institute of Industrial and Science, the University of Tokyo
第 2 著者 氏名(和/英) 喜連川 優 / Masaru Kitsuregawa
第 2 著者 所属(和/英) 東京生産技術研究所
Institute of Industrial and Science, the University of Tokyo
発表年月日 2002/7/11
資料番号 DE2002-52
巻番号(vol) vol.102
号番号(no) 208
ページ範囲 pp.-
ページ数 6
発行日