講演名 | 2003/9/2 サポートベクターマシンを用いた属性選択法の頑健性(一般セッション(8))(データマイニングとパターン認識・メディア理解) 嶋 幸太郎, 等々力 賢, 鈴木 篤之, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | テキスト分類では次元の高さが問題となるため,情報利得,X^2といった指標を用いて属性選択が行われることが多い.しかし,これらの従来手法は属性を個々に評価するため,属性間の関連が考慮されないという問題があった.最近になって,高次元データに対して高い汎化能力を示すことが報告されているサポートベクターマシンを,属性選択に用いる手法が提案された.本研究では,同手法が多変量手法であるために,従来手法よりも頑健に属性を選択できることを示す.さらに,不要属性数を推定する指標を提案する. |
抄録(英) | In text categorization, feature selection plays an important role since the task involves extremely high dimensions. Conventionally, feature selection metrices such as information gain and x^2 has been popularly used. However, these metrices evaluate each feature individually, so associations between features are ignored. Recently, feature selection metric that uses Support Vector Machine (SVM) has been proposed. SVM is basically a classification algorithm which has been known to be particlarly successful for high dimensional data. In this study, we will show that SVM-based feature selection method is more robust in terms of feature selection performance than conventional metrices due to its multivariate nature. Additionally, we will propose a measure to estimate to what extent the number of features can be reduced without deteriorating classification performance. |
キーワード(和) | 属性選択 / サポートベクターマシン / テキスト分類 |
キーワード(英) | Feature Selection / Support Vector Machine / Text Categorization |
資料番号 | PRMU2003-112 |
発行日 |
研究会情報 | |
研究会 | PRMU |
---|---|
開催期間 | 2003/9/2(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Pattern Recognition and Media Understanding (PRMU) |
---|---|
本文の言語 | JPN |
タイトル(和) | サポートベクターマシンを用いた属性選択法の頑健性(一般セッション(8))(データマイニングとパターン認識・メディア理解) |
サブタイトル(和) | |
タイトル(英) | Robustness of Feature Selection based on Support Vector Machines |
サブタイトル(和) | |
キーワード(1)(和/英) | 属性選択 / Feature Selection |
キーワード(2)(和/英) | サポートベクターマシン / Support Vector Machine |
キーワード(3)(和/英) | テキスト分類 / Text Categorization |
第 1 著者 氏名(和/英) | 嶋 幸太郎 / Kotaro SHIMA |
第 1 著者 所属(和/英) | 東京大学大学院工学系研究科 Department of Quantum Engineering and Systems Science, University of Tokyo |
第 2 著者 氏名(和/英) | 等々力 賢 / Masaru TODORIKI |
第 2 著者 所属(和/英) | 東京大学大学院工学系研究科 Department of Quantum Engineering and Systems Science, University of Tokyo |
第 3 著者 氏名(和/英) | 鈴木 篤之 / Atsuyuki SUZUKI |
第 3 著者 所属(和/英) | 東京大学大学院工学系研究科 Department of Quantum Engineering and Systems Science, University of Tokyo |
発表年月日 | 2003/9/2 |
資料番号 | PRMU2003-112 |
巻番号(vol) | vol.103 |
号番号(no) | 296 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |