講演抄録/キーワード |
講演名 |
2014-11-18 15:00
[ポスター講演]分類問題におけるクラスバランス変化への対処法:エネルギー距離を用いたクラス事前確率の推定 ○川久保秀子(東工大)・ドゥ・プレシ マーティヌス・クリストフェル・杉山 将(東大) IBISML2014-71 |
抄録 |
(和) |
標本選択バイアスや環境の非定常性により,訓練標本とテスト標本のクラスのバランスが変化することがある.このような状況で訓練標本を用いて通常通り学習を行うと,学習結果にバイアスが残ってしまう.このバイアスは,テスト標本のクラスのバランスで重みを付けて学習することにより補正できるが,実際の場面ではテスト標本のクラスバランスが未知であることが多い.本論文では,ラベル付きの訓練標本とラベルなしのテスト標本が与えられる半教師付き学習の問題を考え,テスト標本のクラスバランスを推定する方法を論じる.テスト標本のクラスバランスは,クラス毎の訓練入力分布の混合モデルをテスト入力分布に適合させることによって推定できることが示されており,これまでにカルバック・ライブラー距離や $L_2$ 距離などのもとでの推定法が提案されている.本論文では,エネルギー距離を用いた簡便なクラスバランス推定法を提案し,その有効性を計算機実験により示す. |
(英) |
Due to sample selection bias or non-stationarity of the environment, the class balance often changes between training and test datasets. Naive classifier training under such a situation yields a biased solution. This bias can be corrected by weighted training according to the test class balance, but this test class balance is often unknown in practice. In this paper, we consider a semi-supervised learning setup where labeled training samples and unlabeled test samples are available, and address the problem of class balance estimation. It was shown that the test class balance can be estimated by fitting a mixture of class-wise training input distributions to the test input distribution, and class balance estimators were developed under, e.g., the Kullback-Leibler divergence and the $L_2$ distance. In this paper, we propose a simple class balance estimator based on the energy distance and demonstrate its usefulness through experiments. |
キーワード |
(和) |
クラスバランス変化 / クラス事前確率 / エネルギー距離 / / / / / |
(英) |
Class balance change / Class-prior estimation / Energy distance / / / / / |
文献情報 |
信学技報, vol. 114, no. 306, IBISML2014-71, pp. 271-278, 2014年11月. |
資料番号 |
IBISML2014-71 |
発行日 |
2014-11-10 (IBISML) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
IBISML2014-71 |