講演抄録/キーワード |
講演名 |
2009-03-06 09:50
学習データのクラスタリングを用いた文書分類 ○別所克人・内山俊郎・内山 匡(NTT) OIS2008-85 |
抄録 |
(和) |
単語の意味表現としての概念ベクトルを用いた文書分類においては、カテゴリごとに正例文書群を用意し、該カテゴリの特徴ベクトルを、正例文書ベクトル群の重心として表す。本稿では、カテゴリごとに正例文書群をクラスタリングし、得られたクラスタごとに特徴ベクトルを生成することにより、分類精度が向上することを報告する。また、サポートベクタマシンと比べ、より高速な分類を実現できることを示す。 |
(英) |
In the document classification that uses concept vectors as semantic expressions of words, the positive example documents of each category are prepared, and the feature vector of the category is shown as the centroid of the positive example document vectors. This paper shows that the classification accuracy improves by clustering the positive example documents of each category, and generating the feature vector of each obtained cluster. Moreover, it is shown to be able to achieve a more high-speed classification compared with the support vector machine. |
キーワード |
(和) |
概念ベクトル / 文書分類 / クラスタリング / / / / / |
(英) |
Concept Vector / Document Classification / Clustering / / / / / |
文献情報 |
信学技報, vol. 108, 2009年3月. |
資料番号 |
|
発行日 |
2009-02-26 (OIS) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
OIS2008-85 |
研究会情報 |
研究会 |
LOIS |
開催期間 |
2009-03-05 - 2009-03-06 |
開催地(和) |
沖縄県青年会館 |
開催地(英) |
Okinawa-seinen-kaikan |
テーマ(和) |
ライフログ活用技術,オフィス情報システム,ライフインテリジェンス |
テーマ(英) |
Application with Lifelogs, Office Information System, Life Intelligence, etc. |
講演論文情報の詳細 |
申込み研究会 |
LOIS |
会議コード |
2009-03-LOIS |
本文の言語 |
日本語 |
タイトル(和) |
学習データのクラスタリングを用いた文書分類 |
サブタイトル(和) |
|
タイトル(英) |
Document Classification using Clustering of Training Data |
サブタイトル(英) |
|
キーワード(1)(和/英) |
概念ベクトル / Concept Vector |
キーワード(2)(和/英) |
文書分類 / Document Classification |
キーワード(3)(和/英) |
クラスタリング / Clustering |
キーワード(4)(和/英) |
/ |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
別所 克人 / Katsuji Bessho / ベッショ カツジ |
第1著者 所属(和/英) |
日本電信電話株式会社 (略称: NTT)
Nippon Telegraph and Telephone Corporation (略称: NTT) |
第2著者 氏名(和/英/ヨミ) |
内山 俊郎 / Toshio Uchiyama / ウチヤマ トシオ |
第2著者 所属(和/英) |
日本電信電話株式会社 (略称: NTT)
Nippon Telegraph and Telephone Corporation (略称: NTT) |
第3著者 氏名(和/英/ヨミ) |
内山 匡 / Tadasu Uchiyama / ウチヤマ タダス |
第3著者 所属(和/英) |
日本電信電話株式会社 (略称: NTT)
Nippon Telegraph and Telephone Corporation (略称: NTT) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2009-03-06 09:50:00 |
発表時間 |
30分 |
申込先研究会 |
LOIS |
資料番号 |
OIS2008-85 |
巻番号(vol) |
vol.108 |
号番号(no) |
no.462 |
ページ範囲 |
pp.61-64 |
ページ数 |
4 |
発行日 |
2009-02-26 (OIS) |