講演名 | 2006-05-18 確率モデルに基づく文書ストリームからのホットトピック抽出の一検討(「自動化:推論,発見,学習,データマイニング」及び一般) 木村 学, 斉藤 和巳, 上田 修功, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 本稿では、新聞記事のような文書ストリームを対象に、ホットトピック抽出法に関する検討結果を報告する。具体的には、文書出現のバースト性を土台にしたKleinbergの抽出法に村し、単語出現のバースト性を土台にした改良法を提案する。新聞記事一年間分を用いた評価実験では、人手抽出したベンチマークのホットトピック群に対し、Kleinbergのオリジナル抽出法と比較して、提案法が高い抽出性能を示したことを報告する。 |
抄録(英) | In this paper, we address the task of extracting hot topics from document streams such as a series of news papers. To this end, we present a method based on a bursty appearance of words, as a variant of the Kleinberg's method based on a bursty appearance of documents. In our experiments using news papers during one year, we report that the proposed method showed a better extraction performance on a set of benchmark topics extracted by humans, in comparson to the Kleinberg's original method. |
キーワード(和) | ホットトピック抽出 / 文書ストリーム / バースト / 確率モデル |
キーワード(英) | hot topic extraction / document stream / burst / probabilistic model |
資料番号 | AI2006-10 |
発行日 |
研究会情報 | |
研究会 | AI |
---|---|
開催期間 | 2006/5/11(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Artificial Intelligence and Knowledge-Based Processing (AI) |
---|---|
本文の言語 | JPN |
タイトル(和) | 確率モデルに基づく文書ストリームからのホットトピック抽出の一検討(「自動化:推論,発見,学習,データマイニング」及び一般) |
サブタイトル(和) | |
タイトル(英) | A study of hot topic extraction from document stream based on probabilistic models |
サブタイトル(和) | |
キーワード(1)(和/英) | ホットトピック抽出 / hot topic extraction |
キーワード(2)(和/英) | 文書ストリーム / document stream |
キーワード(3)(和/英) | バースト / burst |
キーワード(4)(和/英) | 確率モデル / probabilistic model |
第 1 著者 氏名(和/英) | 木村 学 / Manabu KIMURA |
第 1 著者 所属(和/英) | 奈良先端科学技術大学院大学情報科学研究科 Graduate School of Information Science, Nara Institute of Science and Technology |
第 2 著者 氏名(和/英) | 斉藤 和巳 / Kazumi SAITO |
第 2 著者 所属(和/英) | 日本電信電話株式会社 NTTコミュニケーション科学基礎研究所 NIPPON TELEGRAPH AND TELEPHONE CORPORATION, NTT Communication Science Laboratories |
第 3 著者 氏名(和/英) | 上田 修功 / Naonori UEDA |
第 3 著者 所属(和/英) | 日本電信電話株式会社 NTTコミュニケーション科学基礎研究所 NIPPON TELEGRAPH AND TELEPHONE CORPORATION, NTT Communication Science Laboratories |
発表年月日 | 2006-05-18 |
資料番号 | AI2006-10 |
巻番号(vol) | vol.106 |
号番号(no) | 38 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |