大会名称 |
---|
2009年 情報科学技術フォーラム(FIT) |
大会コ-ド |
F |
開催年 |
2009 |
発行日 |
2009/8/20 |
セッション番号 |
7E |
セッション名 |
語彙・辞書 |
講演日 |
2009/09/04 |
講演場所(会議室等) |
E会場(9号館1F 915教室) |
講演番号 |
E-027 |
タイトル |
情報量基準に基づく形態素解析用辞書の自動獲得方式 |
著者名 |
柳原 正, 池田 和史, 松本 一則, 滝嶋 康弘, |
キーワード |
テキストマイニング, 形態素解析 |
抄録 |
一般的に用いられる形態素解析器では、単語境界や品詞の推定を行う際に形態素解析用辞書が必要である。新しい単語に対応するため、それらの単語を辞書に追加しなければならないが、この作業は人手によって行わなければならないため、コストがかかることが大きな問題となっている。本論文では、情報量基準に基づく形態素解析用辞書の自動獲得方式を提案する。提案内容では、情報量基準に基づくモデル検定によって、単語境界及び品詞を自動推定する。これにより、人手を借りずに形態素解析用辞書を自動的に更新可能となる。 |
本文pdf |
PDF download (221.3KB) |