講演名 | 1997/7/25 人間の重要文判定に基づいた自動要約の試み 野本 忠司, 松本 裕治, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 本稿では大学生を中心とした被験者112名について要約文指摘能力に関する調査を行い、そのデータをもとにした自動要約手法について述べる。要約問題は日本経済新聞95年の記事から随想 (春秋)、社説、一面報道の各分野別に粒度の揃った記事を選び作成した。調査結果はKappa統計と呼ばれる尺度で評価し、さらに調査データから要約文判定の被験者間一致度を調べ、その高低に応じていくつかのデータセットを作成した。一方、自動要約の手法として、C4.5学習アルゴリズムを使い、上記データセットに対する要約モデルの生成とテスト実験をおこなった。実験の結果、K値と自動要約モデルの性能との間に相関傾向があることが認められた。 |
抄録(英) | We discuss a particular approach to automatic abstracting, where an abstract is created by extracting important sentences from a text. A primary purpose of the paper is to demonstrate that the reliability of human supplied annotations on corpora has crucial effects on how well an automatic abstracting system performs. The corpus is developed through human judegments on possible summary sentences in a text. The reliability of human judgements is evaluated by the kappa statistic, a reliability metric standardly used in behavioral sciences. The C4.5 decision tree method (Quinlan, 1993) is used to build a extraction model. We demonstrate that there is a positive correlation of data reliability with a performance of automatic abstracting, and show results indicating that the reliability of human provided data is crucial for improving the performance of automatic abstracting. |
キーワード(和) | 自然言語処理 / 日本語 / 自動要約 / コーパス |
キーワード(英) | NATURAL LANGUAGE PROCESSING / JAPANESE / AUTOMATIC ABSTRACTING / SUMMARIZATION / CORPUS |
資料番号 | NLC97-18 |
発行日 |
研究会情報 | |
研究会 | NLC |
---|---|
開催期間 | 1997/7/25(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Natural Language Understanding and Models of Communication (NLC) |
---|---|
本文の言語 | JPN |
タイトル(和) | 人間の重要文判定に基づいた自動要約の試み |
サブタイトル(和) | |
タイトル(英) | The Reliability of Human Coding and Effects on Automatic Abstracting |
サブタイトル(和) | |
キーワード(1)(和/英) | 自然言語処理 / NATURAL LANGUAGE PROCESSING |
キーワード(2)(和/英) | 日本語 / JAPANESE |
キーワード(3)(和/英) | 自動要約 / AUTOMATIC ABSTRACTING |
キーワード(4)(和/英) | コーパス / SUMMARIZATION |
第 1 著者 氏名(和/英) | 野本 忠司 / Tadashi Nomoto |
第 1 著者 所属(和/英) | (株)日立製作所基礎研究所 Advanced Research Laboratory, Hitachi Ltd. |
第 2 著者 氏名(和/英) | 松本 裕治 / Yuji Matsumoto |
第 2 著者 所属(和/英) | 奈良先端科学技術大学院大学 Nara Institute of Science and Technology |
発表年月日 | 1997/7/25 |
資料番号 | NLC97-18 |
巻番号(vol) | vol.97 |
号番号(no) | 200 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |