講演抄録/キーワード |
講演名 |
2012-11-07 15:30
テキスト分類問題におけるカテゴリ情報を用いた適応的距離学習に関する一考察 ○三川健太・石田 崇・後藤正幸・平澤茂一(早大) IBISML2012-45 |
抄録 |
(和) |
学習データの特徴を表現した行列の学習を行うメトリックラーニングの一手法として拡張余弦尺度が提案されている.しかしながら,拡張余弦尺度は学習データ全体に対し一つの行列を学習するものであり,カテゴリ毎にその特徴が大きく異なることが想定される文書データに対しては改善の余地がある.そこで,本研究ではカテゴリ単位に計量行列を学習する手法を提案すると共に,新聞記事データを用いたシミュレーションにより提案手法の有効性を示す. |
(英) |
Extended cosine measure has been proposed as one of the method of metric learning which learns metric matrix
expressing the characteristics of training data.
However, this method introduces a unique metric matrix and estimate it by learning of all training data.
Therefore, there is a room to improve this method because document data has normally different statistical characteristics
in each category. In this study, we propose the way of learning metric matrices for each category.
To show the effectiveness of our proposed method, simulation experiment is conducted. |
キーワード |
(和) |
メトリックラーニング / 拡張余弦尺度 / ベクトル空間モデル / 文書分類 / / / / |
(英) |
Metric Learning / Extended Cosine Measure / Vector Space Model / Text Classification / / / / |
文献情報 |
信学技報, vol. 112, no. 279, IBISML2012-45, pp. 83-88, 2012年11月. |
資料番号 |
IBISML2012-45 |
発行日 |
2012-10-31 (IBISML) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
IBISML2012-45 |