電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
技報オンライン
‥‥ (ESS/通ソ/エレソ/ISS)
技報アーカイブ
‥‥ (エレソ/通ソ)
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2007-05-25 09:00
単語間の階層関係に基づくテキスト分類方式
別所克人内山俊郎片岡良治NTT
技報オンラインサービス実施中
抄録 (和) 従来のテキスト分類方式は、文書をベクトルとして表現し、コサイン類似度やユークリッド距離のような双方向性のある尺度を、ベクトル間の近さのベースと考えるものが多い。これに対し本稿では、カルバック・ライブラー距離という双方向性のない尺度をテキスト分類に導入する。単語ベクトル間の距離尺度としてカルバック・ライブラー距離を用いると、コサイン類似度を用いた場合と比べ、単語間の連想の様相が変わる。本稿では、この性質を利用し、従来のコサイン類似度やユークリッド距離をベースとする分類方式と、カルバック・ライブラー距離をベースとする分類方式を組み合わせる方式を提案する。評価実験の結果、組み合わせることにより、従来方式よりも精度が向上することを確認した。 
(英) Most of conventional text classification methods use symmetric measures such as cosine similarity or Euclidean metric of feature vectors derived from documents. This paper introduces to use Kullback-Leibler metric, which is non-symmetric, of the vectors for the text classification. We found that Kullback-Leibler metric instead of cosine similarity can reveal different aspect of association between words. Considering this property, this paper proposes the combined classification method which uses both cosine-Euclidean measure and KL metric. The experimental results showed that the proposed method improves classification accuracies of the method using only the cosine-Euclidean measure.
キーワード (和) 概念ベクトル / カルバック・ライブラー距離 / テキスト分類 / / / / /  
(英) Concept Vector / Kullback-Leibler Metric / Text Classification / / / / /  
文献情報 信学技報, vol. 107, no. 57, PRMU2007-15, pp. 79-84, 2007年5月.
資料番号 PRMU2007-15 
発行日 2007-05-17 (PRMU, MI) 
ISSN Print edition: ISSN 0913-5685  Online edition: ISSN 2432-6380

研究会情報
研究会 PRMU MI  
開催期間 2007-05-24 - 2007-05-25 
開催地(和) 三重大学 講堂小ホール 
開催地(英) Mie Univ. 
テーマ(和) センシング技術とその応用 
テーマ(英)  
講演論文情報の詳細
申込み研究会 PRMU 
会議コード 2007-05-PRMU-MI 
本文の言語 日本語 
タイトル(和) 単語間の階層関係に基づくテキスト分類方式 
サブタイトル(和)  
タイトル(英) Text Classification Method Based on Hierarchical Relations among Words 
サブタイトル(英)  
キーワード(1)(和/英) 概念ベクトル / Concept Vector  
キーワード(2)(和/英) カルバック・ライブラー距離 / Kullback-Leibler Metric  
キーワード(3)(和/英) テキスト分類 / Text Classification  
キーワード(4)(和/英) /  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 別所 克人 / Katsuji Bessho / ベッショ カツジ
第1著者 所属(和/英) 日本電信電話株式会社 (略称: NTT)
Nippon Telegraph and Telephone Corporation (略称: NTT)
第2著者 氏名(和/英/ヨミ) 内山 俊郎 / Toshio Uchiyama / ウチヤマ トシオ
第2著者 所属(和/英) 日本電信電話株式会社 (略称: NTT)
Nippon Telegraph and Telephone Corporation (略称: NTT)
第3著者 氏名(和/英/ヨミ) 片岡 良治 / Ryoji Kataoka / カタオカ リョウジ
第3著者 所属(和/英) 日本電信電話株式会社 (略称: NTT)
Nippon Telegraph and Telephone Corporation (略称: NTT)
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者
発表日時 2007-05-25 09:00:00 
発表時間 30 
申込先研究会 PRMU 
資料番号 IEICE-PRMU2007-15,IEICE-MI2007-15 
巻番号(vol) IEICE-107 
号番号(no) no.57(PRMU), no.58(MI) 
ページ範囲 pp.79-84 
ページ数 IEICE-6 
発行日 IEICE-PRMU-2007-05-17,IEICE-MI-2007-05-17 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会