講演名 2010-06-14
統計的機械学習の新展開 : 確率密度比に基づくアプローチ(特別セッション,機械学習とその応用)
杉山 将,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 統計的機械学習のほとんどの課題は,データの生成確率分布の推定を介して解決することができる.しかし,確率分布の推定は機械学習における最も困難な問題の一つとして知られているため,現実的には分布推定を回避しながら対象となる課題を解決することが望ましい.例えば,パターン認識法の一つであるサポートベクトルマシンでは,データの生成確率を推定することなくパターン認識に最低限必要な決定境界を直接学習することにより,高い汎化性能の獲得を可能にした.これまで,分布推定を介さない学習アルゴリズムの開発は,個々の機械学習課題に対して個別に行われてきた.それに対し我々は,様々な機械学習課題に対して統一的に分布推定を避けることのできる汎用的な枠組みを提案してきた.この枠組みでは,確率分布でなく確率密度関数の比を考え,分子と分母の確率密度関数を推定することなくそれらの比を直接推定する.密度比推定によって,重点サンプリング(共変量シフト適応,ドメイン適応,マルチタスク学習),ダイバージェンス推定(二標本検定,外れ値検出,変化点検知),相互情報量推定(独立性検定,独立成分分析,特徴選択,十分次元削減,因果推定),条件付き確率推定(確率的パターン認識,条件付き密度推定)など様々な機械学習課題が解決できることを示してきた.従って,我々の開発してきた密度比直接推定手法を用いることにより,上記の機械学習課題群を一挙に,かつ,高精度に解決できるようになった.本講演では,この枠組の全体像を紹介すると共に,最新の研究成果についても述べる.
抄録(英) Recently, we developed a new ML framework that allows us to systematically avoid density estimation. The key idea is to directly estimate the ratio of density functions, not densities themselves. Our framework includes various ML tasks such as importance sampling (e.g., covariate shift adaptation, transfer learning, multitask learning), divergence estimation (e.g., two-sample test, outlier detection, change detection in time-series), mutual information estimation (e.g., independence test, independent component analysis, feature selection, sufficient dimension eduction, causal inference), and conditional probability estimation (e.g., probabilistic classification, conditional density estimation). In this talk, I introduce the density ratio framework, review methods of density ratio estimation, and show various real-world applications including brain-computer interface, speech recognition, image recognition, and robot control.
キーワード(和) 確率密度比 / 重点サンプリング / ダイバージェンス推定 / 相互情報量推定 / 条件付き確率推定
キーワード(英) probability density ratios / importance sampling / divergence estimation / mutual information estimation / conditional probability estimation
資料番号 IBISML2010-1
発行日

研究会情報
研究会 IBISML
開催期間 2010/6/7(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Information-Based Induction Sciences and Machine Learning (IBISML)
本文の言語 JPN
タイトル(和) 統計的機械学習の新展開 : 確率密度比に基づくアプローチ(特別セッション,機械学習とその応用)
サブタイトル(和)
タイトル(英) Advances in Statistical Machine Learning : An Approach based on Probability Density Ratios
サブタイトル(和)
キーワード(1)(和/英) 確率密度比 / probability density ratios
キーワード(2)(和/英) 重点サンプリング / importance sampling
キーワード(3)(和/英) ダイバージェンス推定 / divergence estimation
キーワード(4)(和/英) 相互情報量推定 / mutual information estimation
キーワード(5)(和/英) 条件付き確率推定 / conditional probability estimation
第 1 著者 氏名(和/英) 杉山 将 / Masashi SUGIYAMA
第 1 著者 所属(和/英) 東京工業大学計算工学専攻
Department of Computer Science, Tokyo Institute of Technology
発表年月日 2010-06-14
資料番号 IBISML2010-1
巻番号(vol) vol.110
号番号(no) 76
ページ範囲 pp.-
ページ数 1
発行日