講演名 2003/9/8
制限カーネルを用いた特徴選択(<特集>「アクティブマイニング」及び一般)
佐土原 健,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本論文は,変数の高次相関を考慮に入れた,新しい特徴選択アルゴリズムを提案する.このアルゴリズムは,学習エンジンとしてサポートベクトルマシンを用いるラッパー法の一種であり,カーネル関数を用いて,変数の組み合わせが張る高次特徴空間上で効率の良い学習を行った後,学習された分類器を分析し分類に寄与しない変数を固定する.この分析は,特徴空間上の超平面として記述される分類器から,ある変数を含む全て成分を取り除いて得られる分類器の制限を計算し,制限された分類器と元の分類器の分類性能を比較することで行われる.ある特定の変数が含まれる変数の組み合わせの数は,一般に非常に大きいが,制限カーネルと呼ばれるカーネル関数を用いることで,分類器の制限を効率良く計算できることが示される.さらに,人工的なデータを用いた実験と,ニュース記事分類タスクの実データを用いた実験により,提案する特徴選択アルゴリズムが,既存のアルゴリズムよりも優れていることが示される.
抄録(英) This paper presents a new feature subset selection algorithm than can take into account higher order correlation between variables. The algorithm is a kind of wrapper methods using Support Vector Machines (SVMs) for learning classifiers represented as hyperplanes spanned by combinations of variables. It is known that kernel functions enable efficient learning of the high dimensional hyperplanes, while this paper considers another use of kernel functions for analyzing the learned classifiers to determine irrelevant variables. In the analysis, the algorithm computes the restriction of a classifier obtained by removing the components containing a variable, and the variable is identified as irrelevant if the restriction discriminates data as well as the classifier. Although there exist numerous components to be removed, it is shown that the restriction can be computed efficiently by using restriction kernels. It is also shown that the presented algorithm outperforms existing algorithms in empirical studies on the synthetic data sets. Furthermore, the algorithm is applied to text categorization tasks and an encouraging result is obtained.
キーワード(和) 特徴選択 / サポートベクトルマシン / カーネル法 / テキスト分類
キーワード(英) feature selection / support vector machine / kernel methods / text categorization
資料番号 AI2003-46
発行日

研究会情報
研究会 AI
開催期間 2003/9/8(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Artificial Intelligence and Knowledge-Based Processing (AI)
本文の言語 ENG
タイトル(和) 制限カーネルを用いた特徴選択(<特集>「アクティブマイニング」及び一般)
サブタイトル(和)
タイトル(英) Feature subset selection using restriction kernels
サブタイトル(和)
キーワード(1)(和/英) 特徴選択 / feature selection
キーワード(2)(和/英) サポートベクトルマシン / support vector machine
キーワード(3)(和/英) カーネル法 / kernel methods
キーワード(4)(和/英) テキスト分類 / text categorization
第 1 著者 氏名(和/英) 佐土原 健 / Ken SADOHARA
第 1 著者 所属(和/英) 産業技術総合研究所
National Institute of Advanced Industrial Science and Technology (AIST)
発表年月日 2003/9/8
資料番号 AI2003-46
巻番号(vol) vol.103
号番号(no) 305
ページ範囲 pp.-
ページ数 6
発行日