大会名称
2010年 情報科学技術フォーラム(FIT)
大会コ-ド
F
開催年
2010
発行日
2010/8/20
セッション番号
1G
セッション名
言語解析
講演日
2010/09/07
講演場所(会議室等)
G会場(総合学習プラザ1F 第11講義室)
講演番号
E-008
タイトル
Webにおける単語出現分布情報を用いた名詞のカテゴリ推定
著者名
宮村 祐一清水 勇詞鈴木 優
キーワード
辞書, 品詞推定, 単語出現分布, サポートベクターマシン
抄録
本論文では、大量のWeb文書の情報を利用して名詞のカテゴリ(地名、人名など)を推定する手法を提案する。従来手法では、推定対象の単語の近傍情報(前後数単語の情報)を用いて推定を行う。それに加え、提案手法では、同じカテゴリに含まれる単語は同じドメインに属するWeb文書に出現しやすいとの仮説に基づき、単語が出現するドメインの分布情報を用いることでカテゴリ推定精度の向上を試みた。Web検索エンジンを利用した実験を行い、名詞のカテゴリ推定精度が向上することを確認した。
本文pdf
PDF download (360.2KB)