大会名称 |
---|
2010年 情報科学技術フォーラム(FIT) |
大会コ-ド |
F |
開催年 |
2010 |
発行日 |
2010/8/20 |
セッション番号 |
2Q |
セッション名 |
検索とアルゴリズム検証 |
講演日 |
2010/09/07 |
講演場所(会議室等) |
Q会場(ウエスト2号館3F 第5講義室) |
講演番号 |
D-012 |
タイトル |
ランダムウォークによるグラフデータのサンプリング手法 |
著者名 |
仲前 晋太郎, 中村 三四郎, 成 凱, |
キーワード |
ランダムサンプリング, ランダムウォーク, グラフデータ |
抄録 |
近年、Web技術の進化に伴い、Blogに代表される、一般の利用者によって自由に発信された情報は著しく増えており、この情報を元に現在の話題に関する分析を行う事が出来る。分析するにあたって、調査対象となるコンテンツを無作為に抽出すること、いわゆる、ランダムサンプリングが重要である。本研究では、ランダムウォークを用いたランダムサンプリング手法として、リンク構造を対象としたサンプリング手法 RRW (Random Walk with a Reservoir )とページを対象としたに対するサンプリング手法IRW (In-Degree Weighted Random Walk)を提案し、評価実験を行った。実験結果によって、平均クラスター係数、入次数、出次数、強連結成分の数、弱連結成分の数の各評価尺度においては、IRWはページを対象としたサンプリングに優れている。RRWは単純ランダムウォークより優れていることが分かった。 |
本文pdf |
PDF download (586.8KB) |