大会名称
2010年 情報科学技術フォーラム(FIT)
大会コ-ド
F
開催年
2010
発行日
2010/8/20
セッション番号
2Q
セッション名
検索とアルゴリズム検証
講演日
2010/09/07
講演場所(会議室等)
Q会場(ウエスト2号館3F 第5講義室)
講演番号
D-012
タイトル
ランダムウォークによるグラフデータのサンプリング手法
著者名
仲前 晋太郎中村 三四郎成 凱
キーワード
ランダムサンプリング, ランダムウォーク, グラフデータ
抄録
近年、Web技術の進化に伴い、Blogに代表される、一般の利用者によって自由に発信された情報は著しく増えており、この情報を元に現在の話題に関する分析を行う事が出来る。分析するにあたって、調査対象となるコンテンツを無作為に抽出すること、いわゆる、ランダムサンプリングが重要である。本研究では、ランダムウォークを用いたランダムサンプリング手法として、リンク構造を対象としたサンプリング手法 RRW (Random Walk with a Reservoir )とページを対象としたに対するサンプリング手法IRW (In-Degree Weighted Random Walk)を提案し、評価実験を行った。実験結果によって、平均クラスター係数、入次数、出次数、強連結成分の数、弱連結成分の数の各評価尺度においては、IRWはページを対象としたサンプリングに優れている。RRWは単純ランダムウォークより優れていることが分かった。
本文pdf
PDF download (586.8KB)