大会名称
2010年 情報科学技術フォーラム(FIT)
大会コ-ド
F
開催年
2010
発行日
2010/8/20
セッション番号
6G
セッション名
情報抽出・検索
講演日
2010/09/09
講演場所(会議室等)
G会場(総合学習プラザ1F 第11講義室)
講演番号
E-034
タイトル
概念辞書を利用した日本語テキストのエンティティ間の意味役割分類
著者名
井口 宜久石塚 満
キーワード
自然言語処理, 意味役割分類, 日本語ワードネット
抄録
WWWや電子アーカイブにおける近年の電子データの急激な増加に伴い、テキストから自動的に情報を抽出するための研究が盛んで、特に最近は意味役割分類という、文中の述語項構造を特定し分類する研究がよく行われている。本研究では、概念記述言語(CDL)を意味構造として用い、述語項構造に限らない、日本語テキストのエンティティ間における意味役割分類を行った。また、コーパスの不足によるデータのスパースネスをおさえるため、日本語ワードネットを用いるという手法を採った。結果として、コーパスの少なさと比較すると、十分に高い精度の分類器を作成し、本手法における日本語ワードネットの使用が効果的であったことを証明した。
本文pdf
PDF download (290.8KB)