大会名称
2009年 情報科学技術フォーラム(FIT)
大会コ-ド
F
開催年
2009
発行日
2009/8/20
セッション番号
7E
セッション名
語彙・辞書
講演日
2009/09/04
講演場所(会議室等)
E会場(9号館1F 915教室)
講演番号
E-026
タイトル
品詞結合規則と外部辞書データを用いた複合名詞の生成
著者名
伊藤 直之西川 侑吾田村 直之中川 修新堀 英二
キーワード
形態素解析, テキストマイニング, 複合名詞生成
抄録
テキストマイニングでアンケートデータなどからキーワードを抽出する際に、形態素解析結果から複合名詞を判定する処理が必要となる。複合名詞は無数に生成されるため、分析前に全ての候補を記述しておくことはできず、語ごとの複合名詞となる際の規則をあらかじめ作成しておく方法も規則数が多く作成コストが大きいといった課題がある。本研究では、単純な品詞結合規則により特定の形態素どうしを結合する手法と外部辞書データの見出し情報とマッチングする手法を組み合わせ、低コストで複合名詞を生成する手法を構築し、精度検証を行った。
本文pdf
PDF download (104.4KB)