講演抄録/キーワード |
講演名 |
2006-07-28 13:50
濃縮還元型文要約モデルの検討 ○池田諭史・牧野 恵・山本和英(長岡技科大) |
抄録 |
(和) |
現在、様々な文要約の研究が行われている。これらの研究は、原文より重要な部分を抜き出すことで文要約を行っている。そのため人間が行う要約のような原文にない表現を用いた要約文になることはない。我々は人間が要約を行うように、原文から必要な表現を抜き出し、その表現を用いて文を作成することで、より自然な要約文の生成を目指した。そこで、人間と同様に原文から要約に必要な表現を抽出し(濃縮)、その表現に機能語を補完することで文を生成する(還元)要約モデルの提案及び検討を行なった。要約に必要な表現の抽出にはSVMを用い、文の生成には原文情報を用いずに他のコーパスによる統計情報を用いて行なった。結果として80%の要約率で要約した際に可読性の評価で36\%、意味の評価で45%の正解率を得た。 |
(英) |
There has been many works on summarization of the sentence.
Most of these them make a summary by extracting words from the original sentence. Therefore, the summary don't have expressions not in the original sentence. In contrast, there are expressions not in the original in manual summarization. Consequently, our aim here is to generate a summary in a natural way that a human does. That is, we propose a summarization method in which we extract terms necessary to make a summary from original sentence, and generate a sentence from those terms. We used SVM for extracting terms necessary to make summarization, and statistical information from general corpus to generate the sentence. The experimental result showed the performance of readability is 36% and meaning identification is 45% under the summary rate of 80%. |
キーワード |
(和) |
自動要約 / 単語抽出 / 文生成 / / / / / |
(英) |
automatic summarization / extract term / generate sentence / / / / / |
文献情報 |
信学技報, vol. 106, no. 191, NLC2006-13, pp. 29-34, 2006年7月. |
資料番号 |
NLC2006-13 |
発行日 |
2006-07-21 (NLC) |
ISSN |
Print edition: ISSN 0913-5685 |
PDFダウンロード |
|