講演名 | 2004/7/7 グラフ構造によるウェブコミュニティの特徴分析 : Max-Flow vs HITS(セッション7A : Webコミュニティ)(夏のデータベースワークショップ : DBWS2004) 今藤 紀子, 喜連川 優, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | ウェブコミュニティ(以降,単にコミュニティと呼ぶ)とは似たようなトピックを扱うウェブページの集合を意味する.これまでにウェブから効率よくコミュニティを抽出する手法が多数提案されてきた.それらの手法は,ウェブにおけるハイパーリンク構造の特徴をそれぞれ異なる視点から捉え,それを反映させたグラフ構造でコミュニティを表現する.本稿では,2手法-HITSアルゴリズムに基づく手法,最大流アルゴリズムを利用する方法-に着目する.両手法が指針とするグラフ構造を比較分析し,トピック規模という概念を導入し,両手法により得られるコミュニティの特徴差を示す.また,2002年の日本国内のウェブページから抽出したコミュニティから成る大規模コミュニティセットを利用した実験を行い,この分析の正当性を検証する. |
抄録(英) | A web community is a set of web pages created by individuals or associations with a common interest on a topic. Various graph theoretical approaches for extracting web communities from the web have been proposed. Each approach specifies a web community by each distinct graph structure, which is well-founded in the context of the link behavior in the web. In this paper, we focus on the web communities extracted by the two approaches; Max-Flow algorithm based and HITS related algorithm based and identify the feature distinction between them. We first analyze a potential feature on the analogy of the graph structure. Next, we verify it by examining two sets of web communities; approximately 1.32 million Max-Flow communities and 1.2 million HITS based communities. Those communities are extracted from the web graph based on Japanese archives in February 2002. |
キーワード(和) | ウェブコミュニティ / 最大流アルゴリズム / HITS |
キーワード(英) | Web community / maximum flow algorithm / HITS |
資料番号 | DE2004-73 |
発行日 |
研究会情報 | |
研究会 | DE |
---|---|
開催期間 | 2004/7/7(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Data Engineering (DE) |
---|---|
本文の言語 | JPN |
タイトル(和) | グラフ構造によるウェブコミュニティの特徴分析 : Max-Flow vs HITS(セッション7A : Webコミュニティ)(夏のデータベースワークショップ : DBWS2004) |
サブタイトル(和) | |
タイトル(英) | Analyzing Feature of Web Communities Max-Flow vs HITS |
サブタイトル(和) | |
キーワード(1)(和/英) | ウェブコミュニティ / Web community |
キーワード(2)(和/英) | 最大流アルゴリズム / maximum flow algorithm |
キーワード(3)(和/英) | HITS / HITS |
第 1 著者 氏名(和/英) | 今藤 紀子 / Noriko IMAFUJI |
第 1 著者 所属(和/英) | 東京大学生産技術研究所 Institute of Industrial Science, University of Tokyo |
第 2 著者 氏名(和/英) | 喜連川 優 / Masaru KITSUREGAWA |
第 2 著者 所属(和/英) | 東京大学生産技術研究所 Institute of Industrial Science, University of Tokyo |
発表年月日 | 2004/7/7 |
資料番号 | DE2004-73 |
巻番号(vol) | vol.104 |
号番号(no) | 177 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |