大会名称
2009年 情報科学技術フォーラム(FIT)
大会コ-ド
F
開催年
2009
発行日
2009/8/20
セッション番号
7E
セッション名
語彙・辞書
講演日
2009/09/04
講演場所(会議室等)
E会場(9号館1F 915教室)
講演番号
E-027
タイトル
情報量基準に基づく形態素解析用辞書の自動獲得方式
著者名
柳原 正池田 和史松本 一則滝嶋 康弘
キーワード
テキストマイニング, 形態素解析
抄録
 一般的に用いられる形態素解析器では、単語境界や品詞の推定を行う際に形態素解析用辞書が必要である。新しい単語に対応するため、それらの単語を辞書に追加しなければならないが、この作業は人手によって行わなければならないため、コストがかかることが大きな問題となっている。本論文では、情報量基準に基づく形態素解析用辞書の自動獲得方式を提案する。提案内容では、情報量基準に基づくモデル検定によって、単語境界及び品詞を自動推定する。これにより、人手を借りずに形態素解析用辞書を自動的に更新可能となる。
本文pdf
PDF download (221.3KB)