講演名 2014-11-18
分類問題におけるクラスバランス変化への対処法 : エネルギー距離を用いたクラス事前確率の推定(情報論的学習理論ワークショップ(IBIS2014))
川久保 秀子, ドゥ・プレシ マーティヌス・クリストフェル, 杉山 将,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 標本選択バイアスや環境の非定常性により,訓練標本とテスト標本のクラスのバランスが変化することがある.このような状況で訓練標本を用いて通常通り学習を行うと,学習結果にバイアスが残ってしまう.このバイアスは,テスト標本のクラスのバランスで重みを付けて学習することにより補正できるが,実際の場面ではテスト標本のクラスバランスが未知であることが多い.本論文では,ラベル付きの訓練標本とラベルなしのテスト標本が与えられる半教師付き学習の問題を考え,テスト標本のクラスバランスを推定する方法を論じる.テスト標本のクラスバランスは,クラス毎の訓練入力分布の混合モデルをテスト入力分布に適合させることによって推定できることが示されており,これまでにカルバック・ライブラー距離やL_2距離などのもとでの推定法が提案されている.本論文では,エネルギー距離を用いた簡便なクラスバランス推定法を提案し,その有効性を計算機実験により示す.
抄録(英) Due to sample selection bias or non-stationarity of the environment, the class balance often changes between training and test datasets. Naive classifier training under such a situation yields a biased solution. This bias can be corrected by weighted training according to the test class balance, but this test class balance is often unknown in practice. In this paper, we consider a semi-supervised learning setup where labeled training samples and unlabeled test samples are available, and address the problem of class balance estimation. It was shown that the test class balance can be estimated by fitting a mixture of class-wise training input distributions to the test input distribution, and class balance estimators were developed under, e.g., the Kullback-Leibler divergence and the L_2 distance. In this paper, we propose a simple class balance estimator based on the energy distance and demonstrate its usefulness through experiments.
キーワード(和) クラスバランス変化 / クラス事前確率 / エネルギー距離
キーワード(英) Class balance change / class-prior estimation / energy distance
資料番号 IBISML2014-71
発行日

研究会情報
研究会 IBISML
開催期間 2014/11/10(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Information-Based Induction Sciences and Machine Learning (IBISML)
本文の言語 ENG
タイトル(和) 分類問題におけるクラスバランス変化への対処法 : エネルギー距離を用いたクラス事前確率の推定(情報論的学習理論ワークショップ(IBIS2014))
サブタイトル(和)
タイトル(英) Coping with Class Balance Change in Classification : Class-Prior Estimation with Energy Distance
サブタイトル(和)
キーワード(1)(和/英) クラスバランス変化 / Class balance change
キーワード(2)(和/英) クラス事前確率 / class-prior estimation
キーワード(3)(和/英) エネルギー距離 / energy distance
第 1 著者 氏名(和/英) 川久保 秀子 / Hideko KAWAKUBO
第 1 著者 所属(和/英) 東京工業大学
Tokyo Institute of Technology
第 2 著者 氏名(和/英) ドゥ・プレシ マーティヌス・クリストフェル / PLESSIS Christoffel DU
第 2 著者 所属(和/英) 東京大学
The University of Tokyo
第 3 著者 氏名(和/英) 杉山 将 / Masashi SUGIYAMA
第 3 著者 所属(和/英) 東京大学
The University of Tokyo
発表年月日 2014-11-18
資料番号 IBISML2014-71
巻番号(vol) vol.114
号番号(no) 306
ページ範囲 pp.-
ページ数 8
発行日