講演抄録/キーワード |
講演名 |
2014-03-06 14:30
標本マハラノビス距離における過学習現象の考察 ○小林靖之(帝京大) IBISML2013-70 |
抄録 |
(和) |
学習サンプル数nが次元数pに近い少数学習サンプルの場合の標本マハラノビス距離において,学習サンプル自身の距離D_i^2が従う分布と学習サンプルと同じ基準に属する検証サンプルの距離T^2が従う分布とが乖離する現象は過学習現象といえる.この現象の回避には両距離の分布が一致すれば良い.そこでモンテカルロ法で発生させたD_i^2のサンプルn個がT^2の分布と確率的に一致する条件を統計的に検討した結果,学習サンプル数nが100以下において両距離の分布が99%の確率で一致する条件は学習サンプル数nが次元数pの大よそ4~5倍以上であった. |
(英) |
When the learning sample size n is near the dimensionality p, the discrepant phenomenon between the distribution of the sample Mahalanobis distance (D_i^2) of the training samples themselves and that of the test samples (T^2) which are in the same standard as the training samples is considered to be a kind of over-learning phenomena. To avoid the phenomena, correspondence between both the distributions of D_i^2 and T^2 is required. The correspondence between these distributions with the probability of 99% or more has been found on condition that n is about four to five times or more than p when n is 100 or less by means of likelihood ratio tests for the case that n-D_i^2 samples generated by MonteCarlo method correspond with the T^2 distribution. |
キーワード |
(和) |
マハラノビス距離 / 過学習 / 尤度比検定 / 少数学習サンプル / / / / |
(英) |
Mahalanobis distance / over-learning / likelihood ratio test / small learning sample size / / / / |
文献情報 |
信学技報, vol. 113, no. 476, IBISML2013-70, pp. 23-30, 2014年3月. |
資料番号 |
IBISML2013-70 |
発行日 |
2014-02-27 (IBISML) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
IBISML2013-70 |