講演名 2003/8/22
文法パターンに基づく用語抽出モデルの構築(言語理解とコミュニケーション一般)
竹内 孔一, 影浦 峡, 小山 照夫, /,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 文法パターンを利用した日本語の用語抽出モデルの構築を行う。用語抽出を行うためには用語らしさをいかに評価することが重要である。我々は用語らしさを「語の意味的構成の強さ」と「分野の特殊性」の2点に分解し、そのうち前者について用語抽出モデルの構築を行った。品詞パターンを利用して語彙的な結束性が強いパターンを記述し、フランス語の用語抽出モデルとして開発されたACABITシステムに適用し用語抽出実験を行った。この実験を通して日本語の品詞パターン及び品詞パターンの元となる日本語の語彙の単位について多言語的観点から考察する。
抄録(英) In this paper, we propose a pattern-based term extraction approach for Japanese, applying ACABIT system originally developed for French. The proposed approach evaluates termhood using morphological patterns of basic terms and term variants. After extracting term candidates, ACABIT system filters out non-terms from the candidates based on log-likelihood. This approach is suitable for Japanese term extraction because most of Japanese terms are compound nouns or simple phrasal patterns.
キーワード(和) 用語抽出 / パターンベース / 文法的パターン / 用語らしさ
キーワード(英) Term extraction / Pattern-based method / Morphological patterns / Termhood
資料番号 NLC2003-20
発行日

研究会情報
研究会 NLC
開催期間 2003/8/22(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 ENG
タイトル(和) 文法パターンに基づく用語抽出モデルの構築(言語理解とコミュニケーション一般)
サブタイトル(和)
タイトル(英) Pattern Based Term Extraction Using ACABIT System
サブタイトル(和)
キーワード(1)(和/英) 用語抽出 / Term extraction
キーワード(2)(和/英) パターンベース / Pattern-based method
キーワード(3)(和/英) 文法的パターン / Morphological patterns
キーワード(4)(和/英) 用語らしさ / Termhood
第 1 著者 氏名(和/英) 竹内 孔一 / Koichi Takeuchi
第 1 著者 所属(和/英) 国立情報学研究所
National Institute of Informatics
第 2 著者 氏名(和/英) 影浦 峡 / Kyo Kageura
第 2 著者 所属(和/英) 国立情報学研究所
National Institute of Informatics
第 3 著者 氏名(和/英) 小山 照夫 / Teruo Koyama
第 3 著者 所属(和/英) 国立情報学研究所
National Institute of Informatics
第 4 著者 氏名(和/英) / / Beatrice Daille
第 4 著者 所属(和/英) /
IRIN-Universite de Nantes
発表年月日 2003/8/22
資料番号 NLC2003-20
巻番号(vol) vol.103
号番号(no) 280
ページ範囲 pp.-
ページ数 6
発行日