講演名 2020-10-22
[招待講演]マルチスケール・ブートストラップ法による選択的推測とその応用
寺田 吉壱(阪大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 従来の統計的推測では,仮説が予め設定されているという前提の下で, 推測の妥当性を保証している. しかし,近年のデータの大規模化や複雑化に伴い, 実データ解析の場面においては,予め仮説を設定するのではなく,データから検証すべき仮説の選択を行い,選ばれた仮説に対して統計的推測を実行することが多い.例えば, 回帰分析においては特徴量選択を行ったあとに選択された特徴量の回帰係数に対して検定を行うことが多い.また, 階層的クラスタリング法における各クラスタに関する検定 (pvclust; Suzuki and Shimodaira, 2006)では,予め仮説を用意するのではなく, データから得られたクラスタに対して検定を行う. このような状況において, 従来の統計的推測を行うと, 仮説の選択と評価に同じデータを用いているため, 深刻なバイアスが生じる. そのため, 選択的推測 (selective inference, post-selection inference)と呼ばれる, データに基づく仮説選択の影響を適切に扱った統計的推測が注目を集めている (Taylor and Tibshirani, 2015). 本発表では, マルチスケール・ブートストラップ法 (Shimodaira 2002, 2004)を用いて, 選択事象や仮説が領域で表現される一般的な状況で選択的推測を行う方法 (Terada and Shimodaira, 2017) をその理論的性質を含めて紹介する. この選択的推測法を用いることで, クラスタに対する検定 (pvclust) や系統樹における統計的推測などの様々な状況において適切な選択的推測を行うことできる (Shimodaira and Terada, 2019). また, この選択的推測の理論を回帰分析の枠組みにおける特徴量選択後の選択的推測に応用したアルゴリズム (Terada and Shimodaira, 2020) を紹介する. これにより, 従来法では困難であった非凸正則化法を含む様々な特徴量選択法に対して選択的推測を行うことが可能となる.
抄録(英) A new selective inference approach via multiscale bootstrap is proposed for general hypotheses conditioned on complicated selective sets. In this approach, we consider the general setting in which the hypothesis and the selection event can be represented as general regions in some parameter space. This method is second-order accurate in the large sample theory of smooth boundary surfaces of regions, and it is also justified for nonsmooth surfaces. Moreover, to computing the selective p-value by this approach, we only need to prepare functions that can tell whether these regions include a realization of the parameter estimate. Since we do not need to know the shapes of regions, this approach can be widely applied. In fact, we introduce several applications of this general approach.
キーワード(和) 仮説検定 / リサンプリング
キーワード(英) Hypothesis testing / Resampling
資料番号 IBISML2020-26
発行日 2020-10-13 (IBISML)

研究会情報
研究会 IBISML
開催期間 2020/10/20(から3日開催)
開催地(和) オンライン開催
開催地(英) Online
テーマ(和) 機械学習の最前線に関するオーガナイズドセッションおよび機械学習一般
テーマ(英) Organized Sessions on Frontiers of Machine Learning and General Sessions
委員長氏名(和) 竹内 一郎(名工大)
委員長氏名(英) Ichiro Takeuchi(Nagoya Inst. of Tech.)
副委員長氏名(和) 杉山 将(東大) / 津田 宏治(東大)
副委員長氏名(英) Masashi Sugiyama(Univ. of Tokyo) / Koji Tsuda(Univ. of Tokyo)
幹事氏名(和) 神嶌 敏弘(産総研) / 岩田 具治(NTT)
幹事氏名(英) Toshihiro Kamishima(AIST) / Tomoharu Iwata(NTT)
幹事補佐氏名(和) 中村 篤祥(北大) / 大羽 成征(京大)
幹事補佐氏名(英) Atsuyoshi Nakamura(Hokkaido Univ.) / Shigeyuki Oba(Kyoto Univ.)

講演論文情報詳細
申込み研究会 Technical Committee on Infomation-Based Induction Sciences and Machine Learning
本文の言語 JPN-ONLY
タイトル(和) [招待講演]マルチスケール・ブートストラップ法による選択的推測とその応用
サブタイトル(和)
タイトル(英)
サブタイトル(和)
キーワード(1)(和/英) 仮説検定 / Hypothesis testing
キーワード(2)(和/英) リサンプリング / Resampling
第 1 著者 氏名(和/英) 寺田 吉壱
第 1 著者 所属(和/英) 大阪大学(略称:阪大)
*(略称:*)
発表年月日 2020-10-22
資料番号 IBISML2020-26
巻番号(vol) vol.120
号番号(no) IBISML-195
ページ範囲 pp.45-45(IBISML),
ページ数 1
発行日 2020-10-13 (IBISML)