講演名 2016-11-16
高次元分類問題のためのSelective Inference
梅津 佑太(名工大), 中川 和也(名工大), 津田 宏治(東大), 竹内 一郎(名工大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 機械学習をはじめとする多くの分野で, データの特徴量が大きな場合, データ解析を行う前の事前処理としてスクリーニングなどを用いて特徴量を減らすことがしばしば行われる. しかし, 観測されたデータから特徴選択を行った場合, その後の統計的推論は選択バイアスを考慮して行わなければならない. このような特徴選択後の統計的推論のひとつとしてselective inferenceと呼ばれるものがある. これまで, データの正規性に基づくselective inferenceが報告されているが, 実際のデータ解析ではこのような仮定は満たされないことが多い. そこで, 本研究では高次元大標本漸近理論を考えることで, selective inferenceを分対問題に拡張する. また, 数値実験を通してその有用性を確認する.
抄録(英) In machine learning and other related area, the number of features is often reduced by some feature selection procedure as a pre-processing for data analysis when it is large. However, once features are selected from the data via some algorithm, we need to correct a selection bias for a statistical inference after feature selection. A selective inference is a kind of statistical inference for correcting the selection bias, and several results are developed until now. Almost results, however, require the normality of the response, so we can not apply it for other important tasks such as classification. In this paper, we extend the selective inference for classification problem based on the high dimensional asymptotic theory. Through some simulation studies, we check the performance of our proposal.
キーワード(和) Family-wise Error Rate / High Dimensional Asymptotics / Hypothesis Testing / Selective Inference
キーワード(英) Family-wise Error Rate / High Dimensional Asymptotics / Hypothesis Testing / Selective Inference
資料番号 IBISML2016-59
発行日 2016-11-09 (IBISML)

研究会情報
研究会 IBISML
開催期間 2016/11/16(から3日開催)
開催地(和) 京都大学
開催地(英) Kyoto Univ.
テーマ(和) 情報論的学習理論ワークショップ(IBIS2016)
テーマ(英) Information-Based Induction Science Workshop (IBIS2016)
委員長氏名(和) 福水 健次(統計数理研)
委員長氏名(英) Kenji Fukumizu(ISM)
副委員長氏名(和) 杉山 将(東大) / 鹿島 久嗣(京大)
副委員長氏名(英) Masashi Sugiyama(Univ. of Tokyo) / Hisashi Kashima(Kyoto Univ.)
幹事氏名(和) 津田 宏治(東大) / 竹内 一郎(名工大)
幹事氏名(英) Koji Tsuda(Univ. of Tokyo) / Ichiro Takeuchi(Nagoya Inst. of Tech.)
幹事補佐氏名(和) 神嶌 敏弘(産総研) / 岩田 具治(NTT)
幹事補佐氏名(英) Toshihiro Kamishima(AIST) / Tomoharu Iwata(NTT)

講演論文情報詳細
申込み研究会 Technical Committee on Infomation-Based Induction Sciences and Machine Learning
本文の言語 JPN
タイトル(和) 高次元分類問題のためのSelective Inference
サブタイトル(和)
タイトル(英) Selective Inference for High-Dimensional Binary Classification
サブタイトル(和)
キーワード(1)(和/英) Family-wise Error Rate / Family-wise Error Rate
キーワード(2)(和/英) High Dimensional Asymptotics / High Dimensional Asymptotics
キーワード(3)(和/英) Hypothesis Testing / Hypothesis Testing
キーワード(4)(和/英) Selective Inference / Selective Inference
第 1 著者 氏名(和/英) 梅津 佑太 / Yuta Umezu
第 1 著者 所属(和/英) 名古屋工業大学(略称:名工大)
Nagoya Institute of Technology(略称:NIT)
第 2 著者 氏名(和/英) 中川 和也 / Kazuya Nakagawa
第 2 著者 所属(和/英) 名古屋工業大学(略称:名工大)
Nagoya Institute of Technology(略称:NIT)
第 3 著者 氏名(和/英) 津田 宏治 / Koji Tsuda
第 3 著者 所属(和/英) 東京大学(略称:東大)
University of Tokyo(略称:Univ. of Tokyo)
第 4 著者 氏名(和/英) 竹内 一郎 / Ichiro Takeuchi
第 4 著者 所属(和/英) 名古屋工業大学(略称:名工大)
Nagoya Institute of Technology(略称:NIT)
発表年月日 2016-11-16
資料番号 IBISML2016-59
巻番号(vol) vol.116
号番号(no) IBISML-300
ページ範囲 pp.93-100(IBISML),
ページ数 8
発行日 2016-11-09 (IBISML)