大会名称
2010年 情報科学技術フォーラム(FIT)
大会コ-ド
F
開催年
2010
発行日
2010/8/20
セッション番号
1G
セッション名
言語解析
講演日
2010/09/07
講演場所(会議室等)
G会場(総合学習プラザ1F 第11講義室)
講演番号
E-005
タイトル
共起頻度を用いた略語の自動推定
著者名
三輪 貴大大工廻 史裕浦谷 則好
キーワード
略語, 共起頻度, パターン
抄録
固有表現抽出,情報検索における網羅性等の向上に略語の活用が有効である.したがって自動的に略語を推定するシステムの有用性は明確である.
形態素毎による文字の組み合わせによって生成した略語候補群に対して,出現パターンにより候補を削減した後,Web上における原語と略語の共起頻度を算出した.共起頻度の特性により更なる候補の削減を行うと共に順位付けして推定を行い,上位3位までを求めた.推定順位1位の精度としては,2形態素においては原語300件中222件(74.0%)となった.また,3形態素においては原語272件中166件(61.0%)となった.上位3位の推定精度はそれぞれ87.3%,83.8%となった.
提案手法は既存の手法より優れていることを示すことができた.
本文pdf
PDF download (542.6KB)