講演名 2001/11/30
新聞記事を対象とした照応解析による抄録の作成
川前 徳章, 青木 輝勝, 安田 浩,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本論文は文書から抄録を作成する新しい手法を提案する。日本語の文書は主語が省略されることが多く、それらが重要な文として抽出された場合、主語のない文が抄録となる問題が生じる。また作成された抄録の評価は人間の主観によることから、客観的な評価基準が必要とされている。提案手法は、これらの問題を解決するために次のようなアプローチを取る。まず、対象とする文書の各文章の主語を特定し、次に照応解析を行って主語がない文書の主語を補完する。次に提案する重み付けを用いて各文書の重要度を測定する。最後にその重要度を用いて文章を抽出し、抄録とする。作成した抄録の客観的な評価基準として本稿では検索精度を用いることを提案する。本論文はこの手法をweb上で閲覧できる210の新聞記事に適用して抄録を作成した。その結果、作成した抄録は主語が補完されているので読みやすく、抽出した抄録の評価を検索精度で評価できることを示した。
抄録(英) We propose new methods to make literature abstracts. In documents written by japanese, Subject is often omitted in a sentence. Therefore a sentence without Subject is measured as an important and selected as an abstract, it is difficult for us to read. And the abstracts are evaluated subjectively by human. This is the reson that we need the standard to evaluate the abstracts objectively. To solve these problems, we take the approach as following. At first, we identify Subject in an each sentence and analysis in anaphora to restore Subject. Secondly, we measure each sentence based on our proposed weighting. Finally, we extract the sentence, by its weight, as an abstract. As an objective evaluation standard, we propose the search precision. In this paper, we applied this method to news articles browsed in web and make their abstracts. As results, the abstracts meet our need and we evaluate them by the search precision.
キーワード(和) 要約抽出 / 照応解析 / ゼロ代名詞 / 情報検索
キーワード(英) Literature Abstract / Anaphora Analysis / Zero Pronouns / Information Retrieval
資料番号 TL2001-32
発行日

研究会情報
研究会 TL
開催期間 2001/11/30(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Thought and Language (TL)
本文の言語 JPN
タイトル(和) 新聞記事を対象とした照応解析による抄録の作成
サブタイトル(和)
タイトル(英) Anaphora in Constructing Literature Abstracts of News Articles
サブタイトル(和)
キーワード(1)(和/英) 要約抽出 / Literature Abstract
キーワード(2)(和/英) 照応解析 / Anaphora Analysis
キーワード(3)(和/英) ゼロ代名詞 / Zero Pronouns
キーワード(4)(和/英) 情報検索 / Information Retrieval
第 1 著者 氏名(和/英) 川前 徳章 / Noriaki KAWAMAE
第 1 著者 所属(和/英) 東京大学先端科学技術研究センター
Research Center for Advanced Research and Technology The University of Tokyo
第 2 著者 氏名(和/英) 青木 輝勝 / Terumasa AOKI
第 2 著者 所属(和/英) 東京大学先端科学技術研究センター
Research Center for Advanced Research and Technology The University of Tokyo
第 3 著者 氏名(和/英) 安田 浩 / Hiroshi YASUDA
第 3 著者 所属(和/英) 東京大学先端科学技術研究センター
Research Center for Advanced Research and Technology The University of Tokyo
発表年月日 2001/11/30
資料番号 TL2001-32
巻番号(vol) vol.101
号番号(no) 485
ページ範囲 pp.-
ページ数 6
発行日