講演名 2013-11-12
K-重交差検証法による改定IP-OLDFとS-SVM,LDF,ロジスティック回帰の評価(ポスターセッション,第16回情報論的学習理論ワークショップ)
新村 秀一,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 誤分類数最小化基準による最適線形判別関数を開発し,判別係数と誤分類数の関係,スイス銀行紙幣データが2変数で線形分離可能(MNM=0)でありこの2変数を含む16個の判別モデルがMNM=0であることなどの新知見を得た.そして,このデータに加えてFisherのアイリスデータ,多重共線性のあるCPDデータ,学生の成績データ,試験の合否判定データから100倍のケース数を持つリサンプリング標本を作成し,改定IP-OLDFをS-SVM,LDF,ロジスティック回帰と100重交差検証法で比較を行った.4種のデータを用いた135個の異なった判別モデルで,検証標本のLDFの平均誤分類確率(MEAN2)は僅か15個,ロジスティック回帰は33個で,MNMの近似値を求める改定IPLP-OLDFのMEAN2より良いだけである.試験の合否判定を設問の得点で2群判別すると自明な判別関数が得られる.大問4問を用いた10%水準(37点)の合否判定で,2変数以上の11個の判別モデルを比較した.S-SVMとLDFとロジスティック回帰のMEAN2と改定IP-OLDFの差を求めると,その範囲は[0.4,1.6],[6.2,10.6],[0.4,1.19]であった.すなわち,LDFのMEAN2は6.2%以上改定IP-OLDFより悪い.これまで確率分布に基づくLDFは汎化能力が良いと考えられてきたが,MNM=0のデータを認識できないばかりか,平均誤分類確率と汎化能力が悪いことが分かった.これに対して改定IP-OLDFは学習標本で過学習するが,検証標本で汎化能力が一番高かった.
抄録(英) Revised IP-OLDF based on MNM (Minimum Number of M isclassifications) is evaluated with S-SVM (Soft margin SVM), LDF (Fisher's Linear Discriminant Function) and logistic regression by 100-fold cross-validation. Re-sampling samples are generated from four real data such as Fisher's Iris data and Swiss bank note data, and pass/fail determinations of my statistical lectures. The means of error rates (MEAN1 and MEAN2) of Revised IP-OLDF are less than those of S-SVM, LDF and logistic regression in the training and validation samples. Especially, LDF can't recognize the linear separable data, and MEAN1 and MEAN2 are very high in the training and validation samples. On the other hand, generalization of Revised IP-OLDF is best in the validation samples, nevertheless it over-estimates in the training samples.
キーワード(和) K-重交差検証法 / 平均誤分類確率最小モデル / 最小誤分類数 / 線形分離可能なデータの判別
キーワード(英) K-fold cross validation / Minimum mean of error rates model / Minimum Number of Misclassifications (MNM) / Discrimination of linear separable data
資料番号 IBISML2013-44
発行日

研究会情報
研究会 IBISML
開催期間 2013/11/5(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Information-Based Induction Sciences and Machine Learning (IBISML)
本文の言語 JPN
タイトル(和) K-重交差検証法による改定IP-OLDFとS-SVM,LDF,ロジスティック回帰の評価(ポスターセッション,第16回情報論的学習理論ワークショップ)
サブタイトル(和)
タイトル(英) Evaluation of Revised IP-OLDF with S-SVM, LDF and logistic regression by K-fold cross-validation
サブタイトル(和)
キーワード(1)(和/英) K-重交差検証法 / K-fold cross validation
キーワード(2)(和/英) 平均誤分類確率最小モデル / Minimum mean of error rates model
キーワード(3)(和/英) 最小誤分類数 / Minimum Number of Misclassifications (MNM)
キーワード(4)(和/英) 線形分離可能なデータの判別 / Discrimination of linear separable data
第 1 著者 氏名(和/英) 新村 秀一 / Shuichi SHINMURA
第 1 著者 所属(和/英) 成蹊大学経済学部
Faculty of Economics, Seikei University
発表年月日 2013-11-12
資料番号 IBISML2013-44
巻番号(vol) vol.113
号番号(no) 286
ページ範囲 pp.-
ページ数 8
発行日