電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
技報オンライン
‥‥ (ESS/通ソ/エレソ/ISS)
技報アーカイブ
‥‥ (エレソ)
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2008-06-19 14:30
単語概念ベクトルを用いた文書群からの代表語抽出
内山俊郎別所克人内山 匡奥 雅博NTT
技報オンラインサービス実施中
抄録 (和) 概念ベース法は,単語の特徴をベクトルで表す方法である.文書群は単語集合で
構成されているので,単語の概念ベクトル集合を持っていることになる.文書群のベクトル
集合の平均は文書群の特徴を表すようになり,検索や分類問題に利用できる。し
かし,文書群には多くの単語が含まれているため,その平均だけでは特徴を十分
に表し切れていない可能性がある.また,ベクトルで表現された特徴は直観的に
理解できないという問題もある.そこで、文書群の代表語によってその特徴を表
す方法を提案する.そのため,文書群のベクトル集合を代表するベクトル集合を
抽出し,ベクトル集合から代表語を求める方法を示す. 
(英) A concept-based method presents feature of words by vectors.
Since documents are composed of a set of words,
they have a set of concept vectors of words. A center of gravity of concept
vectors in documents becomes to present a feature
of documents, and it can be used for a search and classification
problems. However, only one vector such as the center of gravity may
not be enough to present their whole feature, considering a lot of words
in them. It is also a problem that a vector expression is not easy to
be recognized by human directly. Therefore, this paper proposes a novel
method that presents feature of documents by representative words of
the documents. It also presents a method that extracts prototype vectors
from a set of concept vectors and that derives representative words
from the prototype vectors.
キーワード (和) 文書特徴 / 概念ベクトル / クラスタリング / 代表語 / / / /  
(英) Document feature / Concept vector / Clustering / Representative words / / / /  
文献情報 信学技報, vol. 108, no. 94, PRMU2008-27, pp. 47-52, 2008年6月.
資料番号 PRMU2008-27 
発行日 2008-06-12 (DE, PRMU) 
ISSN Print edition: ISSN 0913-5685  Online edition: ISSN 2432-6380

研究会情報
研究会 PRMU DE  
開催期間 2008-06-19 - 2008-06-20 
開催地(和) 小樽市民会館 
開催地(英) Otaru-Shimin-Kaikan 
テーマ(和) 膨大なデータから学ぶもの 
テーマ(英)  
講演論文情報の詳細
申込み研究会 PRMU 
会議コード 2008-06-PRMU-DE 
本文の言語 日本語 
タイトル(和) 単語概念ベクトルを用いた文書群からの代表語抽出 
サブタイトル(和)  
タイトル(英) Extraction of representative words from documents using concept-vectors of words 
サブタイトル(英)  
キーワード(1)(和/英) 文書特徴 / Document feature  
キーワード(2)(和/英) 概念ベクトル / Concept vector  
キーワード(3)(和/英) クラスタリング / Clustering  
キーワード(4)(和/英) 代表語 / Representative words  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 内山 俊郎 / Toshio Uchiyama / ウチヤマ トシオ
第1著者 所属(和/英) 日本電信電話株式会社 (略称: NTT)
Nippon Telegraph and Telephone Corporation (略称: NTT)
第2著者 氏名(和/英/ヨミ) 別所 克人 / Katsuji Bessho / ベッショ カツジ
第2著者 所属(和/英) 日本電信電話株式会社 (略称: NTT)
Nippon Telegraph and Telephone Corporation (略称: NTT)
第3著者 氏名(和/英/ヨミ) 内山 匡 / Tadasu Uchiyama / ウチヤマ タダス
第3著者 所属(和/英) 日本電信電話株式会社 (略称: NTT)
Nippon Telegraph and Telephone Corporation (略称: NTT)
第4著者 氏名(和/英/ヨミ) 奥 雅博 / Masahiro Oku / オク マサヒロ
第4著者 所属(和/英) 日本電信電話株式会社 (略称: NTT)
Nippon Telegraph and Telephone Corporation (略称: NTT)
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者
発表日時 2008-06-19 14:30:00 
発表時間 30 
申込先研究会 PRMU 
資料番号 IEICE-DE2008-9,IEICE-PRMU2008-27 
巻番号(vol) IEICE-108 
号番号(no) no.93(DE), no.94(PRMU) 
ページ範囲 pp.47-52 
ページ数 IEICE-6 
発行日 IEICE-DE-2008-06-12,IEICE-PRMU-2008-06-12 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会