大会名称
2010年 情報科学技術フォーラム(FIT)
大会コ-ド
F
開催年
2010
発行日
2010/8/20
セッション番号
3Q
セッション名
プライバシーと健全性確保
講演日
2010/09/07
講演場所(会議室等)
Q会場(ウエスト2号館3F 第5講義室)
講演番号
RD-001
タイトル
語の共起情報に基づく有害サイトフィルタリング手法
著者名
菊池 琢弥内海 彰
キーワード
有害サイト, フィルタリング, ベイジアンフィルタ, 共起
抄録
本論文では,ベイジアンフィルタをベースに語の共起情報を用いた有害サイトフィルタリング手法を提案する.
ベイジアンフィルタは単語ごとに有害ページに出現する確率を求めることで文書の有害確率を決定するが,
Webサイトにおいては,一般的に有害ではない単語であっても,特定の語との共起により有害な意味を持つ語が存在する.
そこで語の共起情報を考慮し,そのような語の有害さを反映させたフィルタリングを行う.
そして,有害サイト3カテゴリ,非有害サイト3カテゴリを用いた有害サイト判別実験によって,
Robinson-Fisher方式のベイジアンフィルタにおいて,
共起情報を用いることで有害サイトの誤判定率を0.07%まで減少させることが可能であることを示した.
本文pdf
PDF download (395.7KB)