講演名 2002/12/13
重要文抽出と文圧縮による音声自動要約
菊池 智紀, 古井 貞煕, 堀 智織,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿では,これまで我々が提案してきた単語抽出による要約手法の前処理として,重要文抽出を組み合わせた2段階の音声自動要約手法を提案する.本手法では音声認識の結果から,各文の構成単語の重要度,信頼度,言語的自然さの評価値から重要文抽出の要約スコアを求め,それをもとに認識率の低い文,理解困難な文をあらかじめ除いておく.次に,残された文に対して,同様の評価値に単語間遷移スコアを加えた要約スコアを最大にするような,部分単語列を抽出するという手法により要約文を作成し,高精度化をはかる.この手法を用いて講演音声を自動要約し,複数の被験者により作成された正解要約文単語ネットワークに基づく評価を行う.重要文抽出法を用いない従来までの要約手法との要約精度の比較を行った結果,提案手法の有効性が確認された.
抄録(英) This paper proposes a new automatic speech summarization method having two stages: important sentence extraction and sentence compaction. Relatively important sentences are extracted based on the amount of information and the confidence measures of constituent words, and the set of extracted sentences is compressed by our sentence compaction method. The sentence compaction is performed by selecting a word set that maximizes a summarization score consisting of the amount of information and the confidence measure of each word, the linguistic likelihood of word strings, and the word concatenation probability. The selected words are concatenated to create a summary. Effectiveness of the proposed method was confirmed by summarizing spontaneous presentations.
キーワード(和) 話し言葉 / 講演音声 / 音声自動要約 / 重要文抽出 / 単語抽出
キーワード(英) Spontaneous speech / presentation speech / automatic speech summarization / sentence extraction / word extraction
資料番号 NLC2002-81
発行日

研究会情報
研究会 NLC
開催期間 2002/12/13(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 JPN
タイトル(和) 重要文抽出と文圧縮による音声自動要約
サブタイトル(和)
タイトル(英) Automatic speech summarization based on sentence extraction and compaction
サブタイトル(和)
キーワード(1)(和/英) 話し言葉 / Spontaneous speech
キーワード(2)(和/英) 講演音声 / presentation speech
キーワード(3)(和/英) 音声自動要約 / automatic speech summarization
キーワード(4)(和/英) 重要文抽出 / sentence extraction
キーワード(5)(和/英) 単語抽出 / word extraction
第 1 著者 氏名(和/英) 菊池 智紀 / Tomonori KIKUCHI
第 1 著者 所属(和/英) 東京工業大学大学院 情報理工学研究科 計算工学専攻
Department of Computer Science, Tokyo Institute of Technology
第 2 著者 氏名(和/英) 古井 貞煕 / Sadaoki FURUI
第 2 著者 所属(和/英) 東京工業大学大学院 情報理工学研究科 計算工学専攻
Department of Computer Science, Tokyo Institute of Technology
第 3 著者 氏名(和/英) 堀 智織 / Chiori HORI
第 3 著者 所属(和/英) NTTコミュニケーション基礎科学研究所 知能情報部
NTT Communication Science Laboratories
発表年月日 2002/12/13
資料番号 NLC2002-81
巻番号(vol) vol.102
号番号(no) 528
ページ範囲 pp.-
ページ数 6
発行日