講演名 | 2017-11-09 結果的公平な文脈付きバンディット学習 福地 一斗(筑波大), 佐久間 淳(筑波大/JST/理研), |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 機械学習における公平性が,重要な分野として認識されてきている.公平であるとは,機械学習によって行われた意思決定が個人のセンシティブな属性に対して偏らないことである.本論文では,新しい公平性の概念として結果的公平性を紹介し,その制約を設けた順次意思決定問題を取り扱う.結果的公平性は,ほとんど確実に公平性が満たされることを要求する.具体的には,有限回の意思決定を行った結果,不公平な決定が与えられた閾値$eta$をほとんど確実に超えないことを要求する.本稿でははじめに,敵対的文脈における不可能性を示し,この問題が本質的に難しいことを示す.有意義な結果は,分配的文脈設定において得られる.この設定において,$O(max{ln T,min{eta,T/eta}})$のレグレットを達成するアルゴリズムFairUcbを紹介し,$eta le o(ln T)$であるときにはこのレグレットが最適であることを示す. |
抄録(英) | Fairness in machine learning is being recognized as an important field. It requires that the consequent decisions made by a machine learning algorithm must not be biased on the sensitive attributes of individuals. In this paper, we introduce a novel notion of fairness, consequential fairness, and deal with sequential decision-making problems with a consequential fairness constraint. Consequential fairness requires almost sure satisfaction of fairness, that is, the number of unfair decisions does not exceed a prescribed threshold, $eta$, almost surely after a finite number of decisions. We first show a impossibility result for the adversarial context, which implies fundamental hardness of the setting. Meaningful results are obtained under the allocative contexts. We show that a novel algorithm, FairUcb, can achieve $O(max{ln T,min{eta,T/eta}})$ regret under a mild assumption. We also show that this regret bound is optimal up to constant if $eta le o(ln T)$. |
キーワード(和) | 公平性 / 差別 / 文脈付きバンディット / ギャップ依存レグレット / 敵対的文脈 / 分配的文脈 |
キーワード(英) | fairness / discrimination / contextual bandits / gap-dependent regret / adversarial contexts / allocative contexts |
資料番号 | IBISML2017-53 |
発行日 | 2017-11-02 (IBISML) |
研究会情報 | |
研究会 | IBISML |
---|---|
開催期間 | 2017/11/8(から3日開催) |
開催地(和) | 東京大学 |
開催地(英) | Univ. of Tokyo |
テーマ(和) | 情報論的学習理論ワークショップ (IBIS2017) |
テーマ(英) | Information-Based Induction Science Workshop (IBIS2017) |
委員長氏名(和) | 福水 健次(統計数理研) |
委員長氏名(英) | Kenji Fukumizu(ISM) |
副委員長氏名(和) | 杉山 将(東大) / 鹿島 久嗣(京大) |
副委員長氏名(英) | Masashi Sugiyama(Univ. of Tokyo) / Hisashi Kashima(Kyoto Univ.) |
幹事氏名(和) | 竹内 一郎(名工大) / 津田 宏治(東大) |
幹事氏名(英) | Ichiro Takeuchi(Nagoya Inst. of Tech.) / Koji Tsuda(Univ. of Tokyo) |
幹事補佐氏名(和) | 岩田 具治(NTT) / 神嶌 敏弘(産総研) |
幹事補佐氏名(英) | Tomoharu Iwata(NTT) / Toshihiro Kamishima(AIST) |
講演論文情報詳細 | |
申込み研究会 | Technical Committee on Infomation-Based Induction Sciences and Machine Learning |
---|---|
本文の言語 | JPN |
タイトル(和) | 結果的公平な文脈付きバンディット学習 |
サブタイトル(和) | |
タイトル(英) | Consequently Fair Contextual Bandit Learning |
サブタイトル(和) | |
キーワード(1)(和/英) | 公平性 / fairness |
キーワード(2)(和/英) | 差別 / discrimination |
キーワード(3)(和/英) | 文脈付きバンディット / contextual bandits |
キーワード(4)(和/英) | ギャップ依存レグレット / gap-dependent regret |
キーワード(5)(和/英) | 敵対的文脈 / adversarial contexts |
キーワード(6)(和/英) | 分配的文脈 / allocative contexts |
第 1 著者 氏名(和/英) | 福地 一斗 / Kazuto Fukuchi |
第 1 著者 所属(和/英) | 筑波大学(略称:筑波大) University of Tsukuba(略称:Univ. of Tsukuba) |
第 2 著者 氏名(和/英) | 佐久間 淳 / Jun Sakuma |
第 2 著者 所属(和/英) | 筑波大学/科学技術振興機構 CREST/理化学研究所 AIP(略称:筑波大/JST/理研) University of Tsukuba/Japan Science and Technology Agency CREST/RIKEN AIP(略称:Univ. of Tsukuba/JST/RIKEN) |
発表年月日 | 2017-11-09 |
資料番号 | IBISML2017-53 |
巻番号(vol) | vol.117 |
号番号(no) | IBISML-293 |
ページ範囲 | pp.139-146(IBISML), |
ページ数 | 8 |
発行日 | 2017-11-02 (IBISML) |