講演名 2000/5/22
重要文の自動抽出とその評価について
,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 重要文の自動抽出とは、文章中から重要な文を、コンピュータにより抜き出すということである。多くの電子化文書が流通することに従って、重要文の自動抽出は益々重要な課題になり、実用的な自動抽出システムが要請されている。我々は、統計情報と文章の構造特徴に基づくアプローチを用い、科学技術論文の重要文自動抽出システムを開発している。一方、いかに重要文を自動抽出するシステムを評価するかが多くの手法を提案したが、標準的な評価方法までに至ってない。人間の重要文抽出状況を調査した上、一つの評価方法を提案する。最後に、この評価手法を用い、我々のシステムの性能を考察する。
抄録(英) In this paper, we describe a method that uses both statistical and structural information in sentence extraction. In addition, following the analysis of human extractions, several heuristic rules are added to filter non-important sentences and to prevent similar sentence from being extracted. Our exprimental results proved the effectiveness of these means. In particular, once the heuristic rules being added, a significant improvement has been observed. How to evaluation of the quality of the extracted abstract is still an issue. Some methods have been presented to evaluate it. However, there is not a generally accepted good evaluation method. Based on the analysis of the distribution of human extracted important sentences we propose the evaluation criteria for the automatic important sentence extraction system. As the method uses double square roots, we call the method double square root method.
キーワード(和) 自然言語処理 / 重要文の自動抽出 / 統計情報 / 構造特徴
キーワード(英) Natural Language Processing / Automatic Extraction of Important Sentence / Statistical Information / Structural Feature
資料番号 NLC2000-3
発行日

研究会情報
研究会 NLC
開催期間 2000/5/22(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 JPN
タイトル(和) 重要文の自動抽出とその評価について
サブタイトル(和)
タイトル(英) Automatic Extraction of Important Sentences and Its Valuation
サブタイトル(和)
キーワード(1)(和/英) 自然言語処理 / Natural Language Processing
キーワード(2)(和/英) 重要文の自動抽出 / Automatic Extraction of Important Sentence
キーワード(3)(和/英) 統計情報 / Statistical Information
キーワード(4)(和/英) 構造特徴 / Structural Feature
第 1 著者 氏名(和/英) / Ren Fuji
第 1 著者 所属(和/英)
Hiroshima City University
発表年月日 2000/5/22
資料番号 NLC2000-3
巻番号(vol) vol.100
号番号(no) 100
ページ範囲 pp.-
ページ数 7
発行日