結果的公平な文脈付きバンディット学習

福地 一斗; 佐久間 淳

講演名	2017-11-09 結果的公平な文脈付きバンディット学習福地一斗(筑波大), 佐久間淳(筑波大/JST/理研),
PDFダウンロードページ	PDFダウンロードページへ
抄録(和)	機械学習における公平性が，重要な分野として認識されてきている．公平であるとは，機械学習によって行われた意思決定が個人のセンシティブな属性に対して偏らないことである．本論文では，新しい公平性の概念として結果的公平性を紹介し，その制約を設けた順次意思決定問題を取り扱う．結果的公平性は，ほとんど確実に公平性が満たされることを要求する．具体的には，有限回の意思決定を行った結果，不公平な決定が与えられた閾値$eta$をほとんど確実に超えないことを要求する．本稿でははじめに，敵対的文脈における不可能性を示し，この問題が本質的に難しいことを示す．有意義な結果は，分配的文脈設定において得られる．この設定において，$O(max{ln T,min{eta,T/eta}})$のレグレットを達成するアルゴリズムFairUcbを紹介し，$eta le o(ln T)$であるときにはこのレグレットが最適であることを示す．
抄録(英)	Fairness in machine learning is being recognized as an important field. It requires that the consequent decisions made by a machine learning algorithm must not be biased on the sensitive attributes of individuals. In this paper, we introduce a novel notion of fairness, consequential fairness, and deal with sequential decision-making problems with a consequential fairness constraint. Consequential fairness requires almost sure satisfaction of fairness, that is, the number of unfair decisions does not exceed a prescribed threshold, $eta$, almost surely after a finite number of decisions. We first show a impossibility result for the adversarial context, which implies fundamental hardness of the setting. Meaningful results are obtained under the allocative contexts. We show that a novel algorithm, FairUcb, can achieve $O(max{ln T,min{eta,T/eta}})$ regret under a mild assumption. We also show that this regret bound is optimal up to constant if $eta le o(ln T)$.
キーワード(和)	公平性 / 差別 / 文脈付きバンディット / ギャップ依存レグレット / 敵対的文脈 / 分配的文脈
キーワード(英)	fairness / discrimination / contextual bandits / gap-dependent regret / adversarial contexts / allocative contexts
資料番号	IBISML2017-53
発行日	2017-11-02 (IBISML)

研究会情報
研究会	IBISML
開催期間	2017/11/8(から3日開催)
開催地（和）	東京大学
開催地（英）	Univ. of Tokyo
テーマ（和）	情報論的学習理論ワークショップ (IBIS2017)
テーマ（英）	Information-Based Induction Science Workshop (IBIS2017)
委員長氏名（和）	福水健次(統計数理研)
委員長氏名（英）	Kenji Fukumizu(ISM)
副委員長氏名（和）	杉山将(東大) / 鹿島久嗣(京大)
副委員長氏名（英）	Masashi Sugiyama(Univ. of Tokyo) / Hisashi Kashima(Kyoto Univ.)
幹事氏名（和）	竹内一郎(名工大) / 津田宏治(東大)
幹事氏名（英）	Ichiro Takeuchi(Nagoya Inst. of Tech.) / Koji Tsuda(Univ. of Tokyo)
幹事補佐氏名（和）	岩田具治(NTT) / 神嶌敏弘(産総研)
幹事補佐氏名（英）	Tomoharu Iwata(NTT) / Toshihiro Kamishima(AIST)

講演論文情報詳細
申込み研究会	Technical Committee on Infomation-Based Induction Sciences and Machine Learning
本文の言語	JPN
タイトル（和）	結果的公平な文脈付きバンディット学習
サブタイトル（和）
タイトル（英）	Consequently Fair Contextual Bandit Learning
サブタイトル（和）
キーワード(1)（和/英）	公平性 / fairness
キーワード(2)（和/英）	差別 / discrimination
キーワード(3)（和/英）	文脈付きバンディット / contextual bandits
キーワード(4)（和/英）	ギャップ依存レグレット / gap-dependent regret
キーワード(5)（和/英）	敵対的文脈 / adversarial contexts
キーワード(6)（和/英）	分配的文脈 / allocative contexts
第 1 著者氏名（和/英）	福地一斗 / Kazuto Fukuchi
第 1 著者所属（和/英）	筑波大学(略称：筑波大) University of Tsukuba(略称：Univ. of Tsukuba)
第 2 著者氏名（和/英）	佐久間淳 / Jun Sakuma
第 2 著者所属（和/英）	筑波大学/科学技術振興機構 CREST/理化学研究所 AIP(略称：筑波大/JST/理研) University of Tsukuba/Japan Science and Technology Agency CREST/RIKEN AIP(略称：Univ. of Tsukuba/JST/RIKEN)
発表年月日	2017-11-09
資料番号	IBISML2017-53
巻番号（vol）	vol.117
号番号（no）	IBISML-293
ページ範囲	pp.139-146(IBISML),
ページ数	8
発行日	2017-11-02 (IBISML)