講演名 | 2003/8/22 文法パターンに基づく用語抽出モデルの構築(言語理解とコミュニケーション一般) 竹内 孔一, 影浦 峡, 小山 照夫, /, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 文法パターンを利用した日本語の用語抽出モデルの構築を行う。用語抽出を行うためには用語らしさをいかに評価することが重要である。我々は用語らしさを「語の意味的構成の強さ」と「分野の特殊性」の2点に分解し、そのうち前者について用語抽出モデルの構築を行った。品詞パターンを利用して語彙的な結束性が強いパターンを記述し、フランス語の用語抽出モデルとして開発されたACABITシステムに適用し用語抽出実験を行った。この実験を通して日本語の品詞パターン及び品詞パターンの元となる日本語の語彙の単位について多言語的観点から考察する。 |
抄録(英) | In this paper, we propose a pattern-based term extraction approach for Japanese, applying ACABIT system originally developed for French. The proposed approach evaluates termhood using morphological patterns of basic terms and term variants. After extracting term candidates, ACABIT system filters out non-terms from the candidates based on log-likelihood. This approach is suitable for Japanese term extraction because most of Japanese terms are compound nouns or simple phrasal patterns. |
キーワード(和) | 用語抽出 / パターンベース / 文法的パターン / 用語らしさ |
キーワード(英) | Term extraction / Pattern-based method / Morphological patterns / Termhood |
資料番号 | NLC2003-20 |
発行日 |
研究会情報 | |
研究会 | NLC |
---|---|
開催期間 | 2003/8/22(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Natural Language Understanding and Models of Communication (NLC) |
---|---|
本文の言語 | ENG |
タイトル(和) | 文法パターンに基づく用語抽出モデルの構築(言語理解とコミュニケーション一般) |
サブタイトル(和) | |
タイトル(英) | Pattern Based Term Extraction Using ACABIT System |
サブタイトル(和) | |
キーワード(1)(和/英) | 用語抽出 / Term extraction |
キーワード(2)(和/英) | パターンベース / Pattern-based method |
キーワード(3)(和/英) | 文法的パターン / Morphological patterns |
キーワード(4)(和/英) | 用語らしさ / Termhood |
第 1 著者 氏名(和/英) | 竹内 孔一 / Koichi Takeuchi |
第 1 著者 所属(和/英) | 国立情報学研究所 National Institute of Informatics |
第 2 著者 氏名(和/英) | 影浦 峡 / Kyo Kageura |
第 2 著者 所属(和/英) | 国立情報学研究所 National Institute of Informatics |
第 3 著者 氏名(和/英) | 小山 照夫 / Teruo Koyama |
第 3 著者 所属(和/英) | 国立情報学研究所 National Institute of Informatics |
第 4 著者 氏名(和/英) | / / Beatrice Daille |
第 4 著者 所属(和/英) | / IRIN-Universite de Nantes |
発表年月日 | 2003/8/22 |
資料番号 | NLC2003-20 |
巻番号(vol) | vol.103 |
号番号(no) | 280 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |