講演名 2000/7/11
NLC2000-12 聴覚障害者向け字幕放送のためのニュース文自動短文分割
江原 暉将, 福島 孝博, 和田 裕二, 白井 克彦,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 聴覚障害者向け字幕付きテレビ放送番組の制作を支援するために、ニュース番組を対象にして自動要約および自動字幕画面制作の研究を行っている。ニュース文は新聞記事と比較して長文であることが多く、そのまま字幕とすると長すぎて読みにくい場合がある。そこで、長文を自動的に複数の短文に分割する自動短文分割について研究している。本文では、その手法および分割実験の結果について述べる。分割の手法は、かぎ括弧で囲まれた直接引用の分割、上記直接引用の中での句点での分割、接続助詞などを利用して分割点を判断した連用節末での分割である。分割後、文間の結束性を保持するためなどに、分割文の文末の体(常体または敬体)、時制、相を調整し、文頭に接続詞を補うことを行っている。1991年度のテレビニュース記事から100文字以上の長さの文9205文を抽出して分割実験を行ったところ平均文長を133文字から50文字にすることができた。
抄録(英) The authors are investigating automatic summarization and automatic captioning technologies to help TV program production with closed-captions for hearing impaired people. Japanese TV news articles include rather long sentences than news-paper articles. Because long sentences are difficult to read on closed-captions, automatic partitioning of long sentences is effective in both automatic summarization and automatic captioning. The paper shows a automatic partitioning system of long sentences in TV news articles and evaluation results of the partitioning. The system is composed of three phases. First of all, the system partitions direct quotation parts which are quoted by"「"and"」". The second phase partitions several sentences separated by"."in direct quotations. The third phase partitions composed sentences at each clauses using partitioning rules. After the third phase, to keep the coherency of each partitioned sentences, the system inserts appropriate conjunctions at the partitioning points and adjusts politeness, tense and aspect for each sentences. Using 9205 sentences from TV news articles in 1991 which are longer than 100 characters, experiments shows that mean sentence length are from 133 characters to 50 characters before and after partitioning.
キーワード(和) 自然言語処理 / 自動短文分割 / 字幕画面作成 / 自動要約
キーワード(英) natural language processing / automatic sentence partitioning / closed-captioning / automatic summarization
資料番号 NLC2000-12
発行日

研究会情報
研究会 NLC
開催期間 2000/7/11(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 JPN
タイトル(和) NLC2000-12 聴覚障害者向け字幕放送のためのニュース文自動短文分割
サブタイトル(和)
タイトル(英) Automatic Sentence Partitioning of TV News Sentences for Closed Caption Service to Hearing Impaired People
サブタイトル(和)
キーワード(1)(和/英) 自然言語処理 / natural language processing
キーワード(2)(和/英) 自動短文分割 / automatic sentence partitioning
キーワード(3)(和/英) 字幕画面作成 / closed-captioning
キーワード(4)(和/英) 自動要約 / automatic summarization
第 1 著者 氏名(和/英) 江原 暉将 / Terumasa Ehara
第 1 著者 所属(和/英) 通信・放送機構/NHK
Telecommunications Advancement Organization of Japan(TAO)/NHK Science and Technical Research Laboratories
第 2 著者 氏名(和/英) 福島 孝博 / Takahiro Fukushima
第 2 著者 所属(和/英) 通信・放送機構/追手門学院大学
TAO/Ohtemon University
第 3 著者 氏名(和/英) 和田 裕二 / Yuji Wada
第 3 著者 所属(和/英) 通信・放送機構
TAO
第 4 著者 氏名(和/英) 白井 克彦 / Katsuhiko Shirai
第 4 著者 所属(和/英) 通信・放送機構/早稲田大学
TAO/Waseda University
発表年月日 2000/7/11
資料番号 NLC2000-12
巻番号(vol) vol.100
号番号(no) 200
ページ範囲 pp.-
ページ数 6
発行日