講演名 2018-12-07
サポートベクトルに着目した文書分類のための属性選択
逆瀬川 滉大(九大), 廣川 佐千男(九大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 文書分類の性能向上の方法として、サポートベクトルマシーンにおける単語の重要度を用いた、酒井・廣川による属性選択法が提案されている。 本稿では,サポートベクトルにおける単語の出現状況を考慮することで、さらに属性を絞り込む方式を提案する。この手法を,ロイター記事のデータ・セットの分類に適用し、少い単語数でほぼ同じ性能が達成できることが確認できた。
抄録(英) Feature selection is a well-known approach for improving the prediction performance of document classifcation, where crucial words are selected and used in vectorization of the documents. This paper proposes an improvement of feature selection of [Sakai & Hirokawa 2012] by considering the occurences of words in ths support vectors. We conducted the evaluation of the proposed method on reuter dataset and confirmed that the proposed method yields allmost the same performance with a small number of feature words.
キーワード(和) 文書分類 / 機械学習 / 属性選択 / SVM
キーワード(英) document classifcation / machine learning / feature selection / SVM
資料番号 AI2018-25
発行日 2018-11-30 (AI)

研究会情報
研究会 AI
開催期間 2018/12/7(から2日開催)
開催地(和) 九州大学 伊都キャンパス
開催地(英)
テーマ(和) 「コンテキストを意識した知識の利用」および一般
テーマ(英)
委員長氏名(和) 峯 恒憲(九大)
委員長氏名(英) Tsunenori Mine(Kyushu Univ.)
副委員長氏名(和) 片上 大輔(東京工芸大) / 福田 直樹(静岡大)
副委員長氏名(英) Daisuke Katagami(Tokyo Polytechnic Univ.) / Naoki Fukuta(Shizuoka Univ.)
幹事氏名(和) 服部 宏充(立命館大) / 清 雄一(電通大)
幹事氏名(英) Hiromitsu Hattori(Ritsumeikan Univ.) / Yuichi Sei(Univ. of Electro-Comm.)
幹事補佐氏名(和) 櫻井 祐子(産総研)
幹事補佐氏名(英) Yuko Sakurai(AIST)

講演論文情報詳細
申込み研究会 Technical Committee on Artificial Intelligence and Knowledge-Based Processing
本文の言語 JPN
タイトル(和) サポートベクトルに着目した文書分類のための属性選択
サブタイトル(和)
タイトル(英) Feature Selection for Document Classification focused on Support Vector
サブタイトル(和)
キーワード(1)(和/英) 文書分類 / document classifcation
キーワード(2)(和/英) 機械学習 / machine learning
キーワード(3)(和/英) 属性選択 / feature selection
キーワード(4)(和/英) SVM / SVM
第 1 著者 氏名(和/英) 逆瀬川 滉大 / Kota Sakasegawa
第 1 著者 所属(和/英) 九州大学(略称:九大)
Kyushu University(略称:Kyushu Univ.)
第 2 著者 氏名(和/英) 廣川 佐千男 / Sachio Hirokawa
第 2 著者 所属(和/英) 九州大学(略称:九大)
Kyushu University(略称:Kyushu Univ.)
発表年月日 2018-12-07
資料番号 AI2018-25
巻番号(vol) vol.118
号番号(no) AI-350
ページ範囲 pp.1-4(AI),
ページ数 4
発行日 2018-11-30 (AI)