講演名 2003/9/2
サポートベクターマシンを用いた属性選択法の頑健性(一般セッション(8))(データマイニングとパターン認識・メディア理解)
嶋 幸太郎, 等々力 賢, 鈴木 篤之,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) テキスト分類では次元の高さが問題となるため,情報利得,X^2といった指標を用いて属性選択が行われることが多い.しかし,これらの従来手法は属性を個々に評価するため,属性間の関連が考慮されないという問題があった.最近になって,高次元データに対して高い汎化能力を示すことが報告されているサポートベクターマシンを,属性選択に用いる手法が提案された.本研究では,同手法が多変量手法であるために,従来手法よりも頑健に属性を選択できることを示す.さらに,不要属性数を推定する指標を提案する.
抄録(英) In text categorization, feature selection plays an important role since the task involves extremely high dimensions. Conventionally, feature selection metrices such as information gain and x^2 has been popularly used. However, these metrices evaluate each feature individually, so associations between features are ignored. Recently, feature selection metric that uses Support Vector Machine (SVM) has been proposed. SVM is basically a classification algorithm which has been known to be particlarly successful for high dimensional data. In this study, we will show that SVM-based feature selection method is more robust in terms of feature selection performance than conventional metrices due to its multivariate nature. Additionally, we will propose a measure to estimate to what extent the number of features can be reduced without deteriorating classification performance.
キーワード(和) 属性選択 / サポートベクターマシン / テキスト分類
キーワード(英) Feature Selection / Support Vector Machine / Text Categorization
資料番号 PRMU2003-112
発行日

研究会情報
研究会 PRMU
開催期間 2003/9/2(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Pattern Recognition and Media Understanding (PRMU)
本文の言語 JPN
タイトル(和) サポートベクターマシンを用いた属性選択法の頑健性(一般セッション(8))(データマイニングとパターン認識・メディア理解)
サブタイトル(和)
タイトル(英) Robustness of Feature Selection based on Support Vector Machines
サブタイトル(和)
キーワード(1)(和/英) 属性選択 / Feature Selection
キーワード(2)(和/英) サポートベクターマシン / Support Vector Machine
キーワード(3)(和/英) テキスト分類 / Text Categorization
第 1 著者 氏名(和/英) 嶋 幸太郎 / Kotaro SHIMA
第 1 著者 所属(和/英) 東京大学大学院工学系研究科
Department of Quantum Engineering and Systems Science, University of Tokyo
第 2 著者 氏名(和/英) 等々力 賢 / Masaru TODORIKI
第 2 著者 所属(和/英) 東京大学大学院工学系研究科
Department of Quantum Engineering and Systems Science, University of Tokyo
第 3 著者 氏名(和/英) 鈴木 篤之 / Atsuyuki SUZUKI
第 3 著者 所属(和/英) 東京大学大学院工学系研究科
Department of Quantum Engineering and Systems Science, University of Tokyo
発表年月日 2003/9/2
資料番号 PRMU2003-112
巻番号(vol) vol.103
号番号(no) 296
ページ範囲 pp.-
ページ数 6
発行日