講演名 | 2003/12/1 ニューラルネットを用いたテキストの特徴語抽出(一般)(ニューロインフォーマティックスとは何か) 斉藤 和巳, 中野 良平, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 本報告では,統計モデルとして定式化した2種類のニューラルネットを用いて,文書が属すると思われるトピックの推定とトピックを特徴づける単語群の抽出法を論じる.これら推定と抽出法の特徴は,事後確率の最大化によるトピック抽出に着目した目的関数を採用して学習し,その結果として得られたパラメータの大きさに基づいて特徴語を抽出することである.Web上のテキストヘの適用事例を通して,トピック抽出性能と特徴語抽出能力を評価する. |
抄録(英) | In this paper, we discuss methods for detecting an adequate topic of documents and extracting characteristic words of such topics, by using two types of neural networks formalized as statistical models. The main features of these models are that their learning algorithms utilize an objective function that maximizes posterior probabilities for topic detection, and that characteristic words are extracted based on the magnitude of resulting parameter values. Through the experiments using a set of real Web pages, we evaluate the methods in the aspect of topic detection performances and extraction capabilities of characteristic words. |
キーワード(和) | ニューラルネット / ナイーブベイズ / 事後確率 / 特徴語 |
キーワード(英) | neural networks / naive Bayes / posterior probability / characteristic words |
資料番号 | NC2003-95 |
発行日 |
研究会情報 | |
研究会 | NC |
---|---|
開催期間 | 2003/12/1(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Neurocomputing (NC) |
---|---|
本文の言語 | JPN |
タイトル(和) | ニューラルネットを用いたテキストの特徴語抽出(一般)(ニューロインフォーマティックスとは何か) |
サブタイトル(和) | |
タイトル(英) | Extracting Characteristic Words of Text Using Neural Networks |
サブタイトル(和) | |
キーワード(1)(和/英) | ニューラルネット / neural networks |
キーワード(2)(和/英) | ナイーブベイズ / naive Bayes |
キーワード(3)(和/英) | 事後確率 / posterior probability |
キーワード(4)(和/英) | 特徴語 / characteristic words |
第 1 著者 氏名(和/英) | 斉藤 和巳 / Kazumi SAITO |
第 1 著者 所属(和/英) | NTTコミユニケーション科学基礎研究所 NTT Communication Science Laboratories |
第 2 著者 氏名(和/英) | 中野 良平 / Ryohei NAKANO |
第 2 著者 所属(和/英) | 名古屋工業大学 Nagoya Institute of Technology |
発表年月日 | 2003/12/1 |
資料番号 | NC2003-95 |
巻番号(vol) | vol.103 |
号番号(no) | 490 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |