講演抄録/キーワード |
講演名 |
2010-01-25 14:20
個人適応型Splogフィルタリングシステムの実現に向けて ~ Splog判定データセットの構築と機械学習を用いたシステムの実装 ~ ○芳中隆幸(東京電機大)・福原知宏(東大)・増田英孝(東京電機大)・中川裕志(東大) NLC2009-38 |
抄録 |
(和) |
ブログはその特性上, ユーザの嗜好により必要とする情報が異なる.
また, スパムブログ(スプログ, Splog)はメールスパムやWeb スパムとは異なり全てが悪意を持つスパムとは限らず, Splogの中にも一概にスパムとは判断しかねるようなブログ記事が存在している.
そこで我々は, このようなユーザの嗜好を反映可能な柔軟なフィルタとして個人適応型Splogフィルタリングの開発を行う.
開発にあたり, (1)Splog 判定データセットの作成と(2) 機械学習を用いた個人適応型Splogフィルタの実装を行う.
結果として(1) では, Splog 判定には個人差が存在すると分かり, (2) では, 機械学習(SVM) を用いて各ユーザへ最適な判定モデルを作成し, 得られた判定モデルを使用した個人適応型Splog フィルタリングシステムを実装した.
本論文では(1), (2) の実験を通じて得られた個人適応型Splog フィルタリングの効果について報告する. |
(英) |
The wide spread of spam blog (Splog) causes a big problem on today’s Web. The value of blog sites
is different by each user because he or she has various interests. There are “gray” blog sites that are valuable for
some users, but are not valuable for other users. So, those gray sites can not be regard as splogs for all of users.
Therefore, the purpose of this research is to create a user-oriented splog filtering system. We have two evaluation
experiments for creating a user-oriented splog filtering : (1)create splog datasets and (2)develop the system using
the support vector machine(SVM). In this paper, we describe results of these experiments. |
キーワード |
(和) |
スパムブログ / スプログ / フィルタリング / 個人適応 / / / / |
(英) |
Spam Blog / Splog / Filtering / User Adaptable / / / / |
文献情報 |
信学技報, vol. 109, no. 390, NLC2009-38, pp. 31-36, 2010年1月. |
資料番号 |
NLC2009-38 |
発行日 |
2010-01-18 (NLC) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NLC2009-38 |
|