講演名 2009-11-13
タイミングを考慮したリンク解析によるWebトラッキングサイト検知とそのブラックリスト生成
山田 明, 原 正憲, 三宅 優, 橋本 和夫,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) Webトラッキングサイト・Webバグとは,Webページに小さな画像を埋め込むことによって閲覧者のアクセス先に関する情報を収集する方法である.企業組織では,従業員のWebアクセスによって内部情報が流出する危険性があるため問題となっている.これまで,HTMLに含まれる画像のサイズやURLを解析することによって,Webバグを検知する方式が提案されてきた.しかし,近年のWebの発展に伴い,従来方式による検知が困難なサイトが増加している.本稿では,タイミングを考慮したリンク解析によるWebトラッキングサイト検知方式を提案する.提案方式は,LAN内の通信におけるユーザのWebサイト閲覧を解析して,タイミングを考慮したページ間のリンク関係を表すグラフを作成する.そして機械学習を利用することによってトラッキングサイトを検知する.企業LANにおける3ヶ月の通信を用いた評価の結果,提案方式にトラッキングサイトとして検知されたサイトの62-73%が既存のブラックリストに登録されており,残りの96%が登録されていない未知のサイトと疑わしいサイトであることを確認した.
抄録(英) Web tracking sites or Web bugs are potential but serious threats to users' privacy during Web browsing. Web sites and their associated advertising sites surreptitiously gather the profiles of visitors and possibly abuse or improperly expose them, even if visitors do not provide their profiles consciously. In order to prevent such sites in a corporate network, most companies employ filters that rely on blacklists, however, these lists are insufficient. In this paper, we propose Web tracking sites detection and blacklist generation based on temporal link analysis. Our proposal analyzes traffic at the network gateway so that it can monitor all tracking sites in the administrative network. The proposed algorithm constructs a graph between sites and their visited time in order to characterize each site. Then, the system classifies suspicious sites using machine-learning algorithms. We confirm that 62-73% of detected tracking sites are listed on public blacklists, and 96% of unlisted sites are unknown or suspicious tracking sites.
キーワード(和) トラッキングサイト / Webバグ / ブラックリスト / タイミングを考慮したリンク解析 / 機械学習
キーワード(英) Tracking site / Web bug / Web Privacy / Blacklist / Temporal Link Analysis / Machine Learning
資料番号 ICSS2009-58
発行日

研究会情報
研究会 ICSS
開催期間 2009/11/6(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Information and Communication System Security (ICSS)
本文の言語 ENG
タイトル(和) タイミングを考慮したリンク解析によるWebトラッキングサイト検知とそのブラックリスト生成
サブタイトル(和)
タイトル(英) Web Tracking Site Detection and Blacklist Generation Based on Temporal Link Analysis
サブタイトル(和)
キーワード(1)(和/英) トラッキングサイト / Tracking site
キーワード(2)(和/英) Webバグ / Web bug
キーワード(3)(和/英) ブラックリスト / Web Privacy
キーワード(4)(和/英) タイミングを考慮したリンク解析 / Blacklist
キーワード(5)(和/英) 機械学習 / Temporal Link Analysis
第 1 著者 氏名(和/英) 山田 明 / Akira YAMADA
第 1 著者 所属(和/英) 株式会社KDDI研究所
KDDI R & D Laboratories Inc.
第 2 著者 氏名(和/英) 原 正憲 / Masanori HARA
第 2 著者 所属(和/英) KDDI株式会社
KDDI Corporation
第 3 著者 氏名(和/英) 三宅 優 / Yutaka MIYAKE
第 3 著者 所属(和/英) 株式会社KDDI研究所
KDDI R & D Laboratories Inc.
第 4 著者 氏名(和/英) 橋本 和夫 / Kazuo HASHIMOTO
第 4 著者 所属(和/英) 東北大学大学院情報科学研究科
Graduate School of Information Science, Tohoku University
発表年月日 2009-11-13
資料番号 ICSS2009-58
巻番号(vol) vol.109
号番号(no) 285
ページ範囲 pp.-
ページ数 6
発行日