大会名称
2009年 情報科学技術フォーラム(FIT)
大会コ-ド
F
開催年
2009
発行日
2009/8/20
セッション番号
4E
セッション名
検索・分類
講演日
2009/09/03
講演場所(会議室等)
E会場(9号館1F 915教室)
講演番号
E-010
タイトル
Wikipediaから作成した辞書によるブログのカテゴリ分類
著者名
田村 直之伊藤 直之西川 侑吾中川 修新堀 英二
キーワード
ブログ, CGM, Wikipedia, カテゴリ分類
抄録
Wikipediaから自動的に作成した名詞辞書を用いて、ブログを自動カテゴリ分類する手法を提案する。本手法の特徴は、一般的な機械学習によって分類器を作成しブログを分類する手法に比べて、人手による下準備のコストを大幅に下げた点にある。自動分類させたい各カテゴリに対応したWikipediaの項目名、一覧項目名を管理しておけば、常に最新の用語をカテゴリ分類手法に反映可能な為、日々新たな用語が現れるブログ等のCGMテキストの分類に対応が可能である。本手法を用いて、ブログの自動分類実験を行ない、カテゴリ分類の精度について検証した。
本文pdf
PDF download (115KB)