講演名 2001/5/4
文節重要度と係り受け整合度に基づいた文簡約実験
小黒 玲, 高木 一幸, 尾関 和彦,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) これまで主に検討されてきた文書要約手法は, 文集合から重要文を抽出するものである。しかし, 文単位の文書要約手法が必要な場合もあり, その際には簡約文が日本語として自然な文であることが重要である. 我々はこれまでに, 文の簡約を「原文から, 文節重要度と文節間係り受け整合度の総和が最大になる部分文節列を選択する」問題として定式化し, それを解くための効率の良いアルゴリズムを提案している. 本稿では, 文節重要度と文節間係り受け整合度を具体的に定め, このアルゴリズムによる文簡約実験の結果を報告する. 実験結果より, 係り受け整合度の計算には文節の種類毎の頻度を用いた方が良いこと, 文節重要度は要約率が高い場合には, 影響力が強いことがわかった.
抄録(英) Most of text summarization methods reported so far are based on the idea of selecting important sentences from a set of given sentences. However, it, is sometimes necessary to shorten each sentence. In this a case, it is important that a shortened sentence is natural as a Japanese sentence. In this paper we present results of sentence compaction experiments using phrase significance score and inter-phrase dependency score. The results show that information of phrase category frequency is effective for inter-phrse dependency score calculation, and that phrase significance score has more influence on the results in higher compaction rate cases.
キーワード(和) 文簡約 / 文章要約 / 係り受け構造 / 文節重要度
キーワード(英) sentence compaction / text summarization / phrase significance / dependency structure
資料番号 NLC2001-3
発行日

研究会情報
研究会 NLC
開催期間 2001/5/4(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 JPN
タイトル(和) 文節重要度と係り受け整合度に基づいた文簡約実験
サブタイトル(和)
タイトル(英) A Sentence Compaction Experiment Based on Phrase Significance and Inter-phrase Dependency
サブタイトル(和)
キーワード(1)(和/英) 文簡約 / sentence compaction
キーワード(2)(和/英) 文章要約 / text summarization
キーワード(3)(和/英) 係り受け構造 / phrase significance
キーワード(4)(和/英) 文節重要度 / dependency structure
第 1 著者 氏名(和/英) 小黒 玲 / Rei OGURO
第 1 著者 所属(和/英) 電気通信大学
The University of Elector-Communications
第 2 著者 氏名(和/英) 高木 一幸 / Kazuyuki TAKAGI
第 2 著者 所属(和/英) 電気通信大学
The University of Elector-Communications
第 3 著者 氏名(和/英) 尾関 和彦 / Kazuhiko OZEKI
第 3 著者 所属(和/英) 電気通信大学
The University of Elector-Communications
発表年月日 2001/5/4
資料番号 NLC2001-3
巻番号(vol) vol.101
号番号(no) 40
ページ範囲 pp.-
ページ数 6
発行日