講演名 1999/7/22
独立話題分析 : 独立性最大化による特徴的話題の抽出
篠原 靖志,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 文書データベースにおける特徴的話題を見つけ出すことは、文書データの整理・検索・要約などにおいて重要な役割を果たす。本稿では、文書データベース中での特徴的話題の組を、その話題を特徴づける単語の生起が互いに独立な話題の組として定義し、その抽出方法として、数量化III類型独立成分分析を提案する。さらに、実験により、数量化III類の持つ情報圧縮性を組み合わせることで、独立性の高い文書・単語へのグループ化が行えることを示す。
抄録(英) Topic plays important role in organizing/retrieving/summarizing documents in a document database. Especially, the topics characterizing groups of documents in the database are useful. We define these characteristic topics as independent topics and propose the mothod called "Dual Scaling Type Indpendent Component Analysis" to find them. We also show the method find the independent groups of documents and words characterized by the found topics combining the reduction of dimensionality by dual scaling.
キーワード(和) 独立成分分析 / 話題抽出 / 文書検索 / 数量化III類
キーワード(英) Indpendent Component Analysis / Topic Extraction / Text Retrieval / Dual Scaling
資料番号 AI99-26
発行日

研究会情報
研究会 AI
開催期間 1999/7/22(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Artificial Intelligence and Knowledge-Based Processing (AI)
本文の言語 JPN
タイトル(和) 独立話題分析 : 独立性最大化による特徴的話題の抽出
サブタイトル(和)
タイトル(英) Independent Topic Analysis : Extraction of Characteristic Topics by maximization of Independence
サブタイトル(和)
キーワード(1)(和/英) 独立成分分析 / Indpendent Component Analysis
キーワード(2)(和/英) 話題抽出 / Topic Extraction
キーワード(3)(和/英) 文書検索 / Text Retrieval
キーワード(4)(和/英) 数量化III類 / Dual Scaling
第 1 著者 氏名(和/英) 篠原 靖志 / Yasusi Sinohara
第 1 著者 所属(和/英) (財)電力中央研究所 情報研究所
Communication and Information Research Laboratory Central Research Institute of Electric Power Industry
発表年月日 1999/7/22
資料番号 AI99-26
巻番号(vol) vol.99
号番号(no) 225
ページ範囲 pp.-
ページ数 8
発行日