講演名 2015-06-23
多重仮説検定の差分プライバシー
柿崎 和也(筑波大), 佐久間 淳(筑波大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 仮説検定において検定統計量を個人データから算出し公開したときに, その検定統計量から個人に関する機微な情報 (e.g., ある個人がケース群かコントロール群か)が推測される可能性がある. 特に多重検定において多数の検定統計量を公開する場合, 個人情報の推測の可能性は格段に高まる. 統計量の公開に伴う個人情報推測のリスクは,差分プライバシーによって定量化される. 多重検定における統計統計量の公開において, 加法的なノイズを用いて差分ブライバシーを保護した場合, ナイーブな結合定理に基づけば検定数に比例した標準偏差のノイズを加える必要がある. このため, SNPなど極めて多数の属性についての多重検定を行う場合において, 差分プライバシを保護するためには, 分散のノイズを非常に大きくする必要があり, 実用的ではない. 本稿では, $chi^2$独立性検定における差分プライバシ保護において, 統計検定量に加えるノイズの分散を以下の二つの工夫によって抑える方法を提案する. 一つは, 無限次数多重検定法 (LAMP)を用いて, 多重検定対象なる検定数を抑える方法である. もう一つは, 興味がある(公開する)統計検定量は帰無仮説が棄却される場合に限られることに着目し, 指数メカニズムを用いて結合定理の対象となるクエリ数を削減する方法である. 提案法の有効性を, 人工データおよび実データを用いて実験的に確認するとともに, 正しい多重検定の結論を導くために必要となる差分プライバシを定量的に評価する.
抄録(英) Statistical hypothesis testing using test statistics ($p$-value) are commonly used for identification of new scientific findings.if a large number of test statistics are released as results of multiple hypothesis testing,it might allow to infer information associated with a specified individual from the test statistics. Differential privacy allows us to quantify information leakage caused by disclosure of statistics.This paper introduces a differential private multiple hypothesis testing framework based on the Limitless Arity Multiple Testing (LAMP) algorithm.This algorithm publishes test statistics of multiple hypothesis testing with high precision under guarantee of differential privacy.
キーワード(和) 差分プライバシー / 多重検定 / 無限次数多重検定法
キーワード(英) Differential Privacy / Multiple Hypothesis Testing / Limitless Arity Multiple Testing
資料番号 IBISML2015-8
発行日 2015-06-16 (IBISML)

研究会情報
研究会 NC / IPSJ-BIO / IBISML / IPSJ-MPS
開催期間 2015/6/23(から3日開催)
開催地(和) 沖縄科学技術大学院大学
開催地(英) Okinawa Institute of Science and Technology
テーマ(和) 機械学習によるバイオデータマインニング、一般
テーマ(英) Machine Learning Approach to Biodata Mining, and General
委員長氏名(和) 斎藤 利通(法政大) / 関嶋 政和(東工大) / 鷲尾 隆(阪大) / 庄野 逸(電通大)
委員長氏名(英) Toshimichi Saito(Hosei Univ.) / Masakazu Sekijima(東工大) / Takashi Washio(Osaka Univ.) / Hayaru Shouno(電通大)
副委員長氏名(和) 佐藤 茂雄(東北大) / / 福水 健次(統計数理研) / 杉山 将(東工大)
副委員長氏名(英) Shigeo Sato(Tohoku Univ.) / / Kenji Fukumizu(ISM) / Masashi Sugiyama(Tokyo Inst. of Tech.)
幹事氏名(和) 堀尾 恵一(九工大) / 田中 宏喜(京都産大) / 大羽 成征(京大) / 瀬々 潤(お茶の水女子大) / 吉本 潤一郎(OIST) / 松井 知子(統計数理研) / 大羽 成征(京大) / 小野 智司(鹿児島大) / 但馬 康宏(岡山県立大) / 林田 守広(京大) / 岩田 具治(NTT) / 吉田 哲也(北大) / 松田 健(静岡理工科大)
幹事氏名(英) Keiichi Horio(Kyushu Inst. of Tech.) / Hiroki Tanaka(Kyoto Sangyo Univ.) / Shigeyuki Oba(京大) / Jun Sese(お茶の水女子大) / Junichiro Yoshimoto(OIST) / Tomoko Matsui(ISM) / Shigeyuki Ohba(Kyoto Univ.) / Satoshi Ono(鹿児島大) / Yasuhiro Tajima(岡山県立大) / Morihiro Hayashida(京大) / Tomoharu Iwata(NTT) / Tetsuya Yoshida(北大) / Takeshi Matsuda(静岡理工科大)
幹事補佐氏名(和) 神原 裕行(東工大) / 秋間 学尚(東北大) / / 津田 宏治(東大) / 鹿島 久嗣(京大)
幹事補佐氏名(英) Hiroyuki Kanbara(Tokyo Inst. of Tech.) / Hisanao Akima(Tohoku Univ.) / / Koji Tsuda(Univ. of Tokyo) / Hisashi Kashima(Kyoto Univ.)

講演論文情報詳細
申込み研究会 Technical Committee on Neurocomputing / Special Interest Group on Bioinformatics and Genomics / Technical Committee on Infomation-Based Induction Sciences and Machine Learning / Special Interest Group on Mathematical Modeling and Problem Solving
本文の言語 JPN
タイトル(和) 多重仮説検定の差分プライバシー
サブタイトル(和)
タイトル(英) Differentially Private Multiple Hypothesis Testing
サブタイトル(和)
キーワード(1)(和/英) 差分プライバシー / Differential Privacy
キーワード(2)(和/英) 多重検定 / Multiple Hypothesis Testing
キーワード(3)(和/英) 無限次数多重検定法 / Limitless Arity Multiple Testing
第 1 著者 氏名(和/英) 柿崎 和也 / Kazuya Kakizaki
第 1 著者 所属(和/英) 筑波大学(略称:筑波大)
Tsukuba University(略称:Tsukuba Univ.)
第 2 著者 氏名(和/英) 佐久間 淳 / Jun Sakuma
第 2 著者 所属(和/英) 筑波大学(略称:筑波大)
Tsukuba University(略称:Tsukuba Univ.)
発表年月日 2015-06-23
資料番号 IBISML2015-8
巻番号(vol) vol.115
号番号(no) IBISML-112
ページ範囲 pp.47-54(IBISML),
ページ数 8
発行日 2015-06-16 (IBISML)