講演名 2003/12/1
ニューラルネットを用いたテキストの特徴語抽出(一般)(ニューロインフォーマティックスとは何か)
斉藤 和巳, 中野 良平,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本報告では,統計モデルとして定式化した2種類のニューラルネットを用いて,文書が属すると思われるトピックの推定とトピックを特徴づける単語群の抽出法を論じる.これら推定と抽出法の特徴は,事後確率の最大化によるトピック抽出に着目した目的関数を採用して学習し,その結果として得られたパラメータの大きさに基づいて特徴語を抽出することである.Web上のテキストヘの適用事例を通して,トピック抽出性能と特徴語抽出能力を評価する.
抄録(英) In this paper, we discuss methods for detecting an adequate topic of documents and extracting characteristic words of such topics, by using two types of neural networks formalized as statistical models. The main features of these models are that their learning algorithms utilize an objective function that maximizes posterior probabilities for topic detection, and that characteristic words are extracted based on the magnitude of resulting parameter values. Through the experiments using a set of real Web pages, we evaluate the methods in the aspect of topic detection performances and extraction capabilities of characteristic words.
キーワード(和) ニューラルネット / ナイーブベイズ / 事後確率 / 特徴語
キーワード(英) neural networks / naive Bayes / posterior probability / characteristic words
資料番号 NC2003-95
発行日

研究会情報
研究会 NC
開催期間 2003/12/1(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Neurocomputing (NC)
本文の言語 JPN
タイトル(和) ニューラルネットを用いたテキストの特徴語抽出(一般)(ニューロインフォーマティックスとは何か)
サブタイトル(和)
タイトル(英) Extracting Characteristic Words of Text Using Neural Networks
サブタイトル(和)
キーワード(1)(和/英) ニューラルネット / neural networks
キーワード(2)(和/英) ナイーブベイズ / naive Bayes
キーワード(3)(和/英) 事後確率 / posterior probability
キーワード(4)(和/英) 特徴語 / characteristic words
第 1 著者 氏名(和/英) 斉藤 和巳 / Kazumi SAITO
第 1 著者 所属(和/英) NTTコミユニケーション科学基礎研究所
NTT Communication Science Laboratories
第 2 著者 氏名(和/英) 中野 良平 / Ryohei NAKANO
第 2 著者 所属(和/英) 名古屋工業大学
Nagoya Institute of Technology
発表年月日 2003/12/1
資料番号 NC2003-95
巻番号(vol) vol.103
号番号(no) 490
ページ範囲 pp.-
ページ数 6
発行日