講演名 1998/7/24
短文分割を利用したテレビ字幕用自動要約
若尾 孝博, 江原 暉将, 白井 克彦,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本研究の題材であるテレビニュース番組の電子化原稿は、1記事中の文数が多くなく、1文当たりの文字数が多いといる特徴がある。この為、自動要約として重要文抽出を行うと、情報が文単位で取捨選択され、粗い要約となりがちである。そこで、本研究では、長文を分割出来る条件を設定し、条件に合う場合は、短い文に分割するといる処理を行ってから、重要文抽出を行った。そして、短文分割を行う場合と行わない場合での重要文抽出について検討を行った。
抄録(英) It is known that there are fewer sentences in a TV news text and the sentences are longer compared with those in a newspaper article. We use such TV news texts and would like to summarize them by selecting important sentences. However, since each sentences is rather long, we end up losing a good amount of information if we omit a whole sentence. Therefore, we adopted a method in which we partition long sentences into shorter sentences, and select important sentences from them. We evaluate the results of the method as well as those of the simple sentence extraction where there is no partitioning of the sentences.
キーワード(和) 重量文抽出 / 短文分割 / 自動要約 / TVニュース原稿
キーワード(英) Sentence extraction / Sentence partitioning / Text summarization / TV news text
資料番号 NLC98-15
発行日

研究会情報
研究会 NLC
開催期間 1998/7/24(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 JPN
タイトル(和) 短文分割を利用したテレビ字幕用自動要約
サブタイトル(和)
タイトル(英) Partitioning long sentences: how useful it is for sentences extraction
サブタイトル(和)
キーワード(1)(和/英) 重量文抽出 / Sentence extraction
キーワード(2)(和/英) 短文分割 / Sentence partitioning
キーワード(3)(和/英) 自動要約 / Text summarization
キーワード(4)(和/英) TVニュース原稿 / TV news text
第 1 著者 氏名(和/英) 若尾 孝博 / Takahiro Wakao
第 1 著者 所属(和/英) 通信・放送機構(TAO)渋谷上原リサーチセンター
TAO of Japan
第 2 著者 氏名(和/英) 江原 暉将 / Terumasa Ehara
第 2 著者 所属(和/英) NHK/TAO
NHK/TAO
第 3 著者 氏名(和/英) 白井 克彦 / Katsuhiko Shirai
第 3 著者 所属(和/英) 早稲田大学/TAO
Waseda University/TAO
発表年月日 1998/7/24
資料番号 NLC98-15
巻番号(vol) vol.98
号番号(no) 210
ページ範囲 pp.-
ページ数 6
発行日