講演名 2006-07-14
Web検索のための質問キーワードの時間依存性に基づくクラスタリング手法(メタデータ)
賀家 智代, 角谷 和俊,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 現在,Web検索のための検索エンジンが普及しているが,検索結果として呈示されるWebページの内容や観点は多岐にわたっていて,重要度の高いWebページがユーザの意図に合致するとは限らない.そのためWeb検索結果を解析することによって,トピックごとや関連の深いページをクラスタリングして呈示する手法がいくつか提案されている.一般に,同じトピックや関連の深いページであっても質問キーワードに関して異なる観点のWebページが混在する場合がある.一時点のWebページのみを解析する手法ではキーワードに関する観点の分析は難しく,このような問題は解決されない.そこで本研究では,時系列的な特性に基づく新たなクラスタリング方式を提案する.Webアーカイブに蓄積された過去のWebページを利用することによって,質問キーワードに関する観点の違いに基づくURLの分類を行う.手順としては,質問キーワードを含むURLを抽出し,URL毎にキーワードの出現傾向を解析する.次にキーワードの時間依存性に基づきWebページを検索し,最後にその結果をクラスタリングして呈示する.本稿では提案する手法について述べ,評価及び分析を検討する.
抄録(英) The Web search engines based on the keywords are popular because it is easy for users to retrieve information. However, retrieved Web pages have various contents and perspectives, and the pages do not match users' intentions because level of importance is high. For the reasons stated above, some clustering methods of topic or relationship are proposed. The clustering methods are divided into methods based on contents and methods based on structure. However, same topic' s or related pages may be mixed-up some perspectives about query keywords. It is difficult for the conventional methods analyzing only today to analyze the perspectives about query keywords, and the methods can not solve the problem. In this study, we propose new clustering method based on a temporal aspect. We classify retrieved pages into same perspectives groups about query keywords by Web logs. First, we extract URLs included query keywords and analyze appearance tendencies of the keywords' each URL. Next, we retrieve Web pages based on the temporal relations of query keywords. Retrieved Web pages are clustered based on the temporal relations. In this paper, we describe our proposed method and examine the evaluation and the analysis.
キーワード(和) 情報検索 / クラスタリング / Webアーカイブ
キーワード(英) Information Retrieval / Web Archive / Clustering
資料番号 DE2006-118
発行日

研究会情報
研究会 DE
開催期間 2006/7/7(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Data Engineering (DE)
本文の言語 JPN
タイトル(和) Web検索のための質問キーワードの時間依存性に基づくクラスタリング手法(メタデータ)
サブタイトル(和)
タイトル(英) A Clustering Method Based on the Temporal Relation of Query Keywords for Web Search
サブタイトル(和)
キーワード(1)(和/英) 情報検索 / Information Retrieval
キーワード(2)(和/英) クラスタリング / Web Archive
キーワード(3)(和/英) Webアーカイブ / Clustering
第 1 著者 氏名(和/英) 賀家 智代 / Tomoyo KAGE
第 1 著者 所属(和/英) 兵庫県立大学大学院環境人間学研究科
Graduate School of Human Science and Environment, University of Hyogo
第 2 著者 氏名(和/英) 角谷 和俊 / Kazutoshi SUMIYA
第 2 著者 所属(和/英) 兵庫県立大学環境人間学部
School of Human Science and Environment, University of Hyogo
発表年月日 2006-07-14
資料番号 DE2006-118
巻番号(vol) vol.106
号番号(no) 150
ページ範囲 pp.-
ページ数 6
発行日