講演名 | 2002/12/13 重要文抽出と文圧縮による音声自動要約 菊池 智紀, 古井 貞煕, 堀 智織, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 本稿では,これまで我々が提案してきた単語抽出による要約手法の前処理として,重要文抽出を組み合わせた2段階の音声自動要約手法を提案する.本手法では音声認識の結果から,各文の構成単語の重要度,信頼度,言語的自然さの評価値から重要文抽出の要約スコアを求め,それをもとに認識率の低い文,理解困難な文をあらかじめ除いておく.次に,残された文に対して,同様の評価値に単語間遷移スコアを加えた要約スコアを最大にするような,部分単語列を抽出するという手法により要約文を作成し,高精度化をはかる.この手法を用いて講演音声を自動要約し,複数の被験者により作成された正解要約文単語ネットワークに基づく評価を行う.重要文抽出法を用いない従来までの要約手法との要約精度の比較を行った結果,提案手法の有効性が確認された. |
抄録(英) | This paper proposes a new automatic speech summarization method having two stages: important sentence extraction and sentence compaction. Relatively important sentences are extracted based on the amount of information and the confidence measures of constituent words, and the set of extracted sentences is compressed by our sentence compaction method. The sentence compaction is performed by selecting a word set that maximizes a summarization score consisting of the amount of information and the confidence measure of each word, the linguistic likelihood of word strings, and the word concatenation probability. The selected words are concatenated to create a summary. Effectiveness of the proposed method was confirmed by summarizing spontaneous presentations. |
キーワード(和) | 話し言葉 / 講演音声 / 音声自動要約 / 重要文抽出 / 単語抽出 |
キーワード(英) | Spontaneous speech / presentation speech / automatic speech summarization / sentence extraction / word extraction |
資料番号 | SP2002-158 |
発行日 |
研究会情報 | |
研究会 | SP |
---|---|
開催期間 | 2002/12/13(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Speech (SP) |
---|---|
本文の言語 | JPN |
タイトル(和) | 重要文抽出と文圧縮による音声自動要約 |
サブタイトル(和) | |
タイトル(英) | Automatic speech summarization based on sentence extraction and compaction |
サブタイトル(和) | |
キーワード(1)(和/英) | 話し言葉 / Spontaneous speech |
キーワード(2)(和/英) | 講演音声 / presentation speech |
キーワード(3)(和/英) | 音声自動要約 / automatic speech summarization |
キーワード(4)(和/英) | 重要文抽出 / sentence extraction |
キーワード(5)(和/英) | 単語抽出 / word extraction |
第 1 著者 氏名(和/英) | 菊池 智紀 / Tomonori KIKUCHI |
第 1 著者 所属(和/英) | 東京工業大学大学院 情報理工学研究科計算工学 Department of Computer Science, Tokyo Institute of Technology |
第 2 著者 氏名(和/英) | 古井 貞煕 / Sadaoki FURUI |
第 2 著者 所属(和/英) | 東京工業大学大学院 情報理工学研究科計算工学 Department of Computer Science, Tokyo Institute of Technology |
第 3 著者 氏名(和/英) | 堀 智織 / Chiori HORI |
第 3 著者 所属(和/英) | NTTコミュニケーション基礎科学研究所 知能情報部 NTT Communication Science Laboratories |
発表年月日 | 2002/12/13 |
資料番号 | SP2002-158 |
巻番号(vol) | vol.102 |
号番号(no) | 530 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |