講演抄録/キーワード |
講演名 |
2017-11-09 13:00
結果的公平な文脈付きバンディット学習 ○福地一斗(筑波大)・佐久間 淳(筑波大/JST/理研) IBISML2017-53 |
抄録 |
(和) |
機械学習における公平性が,重要な分野として認識されてきている.公平であるとは,機械学習によって行われた意思決定が個人のセンシティブな属性に対して偏らないことである.本論文では,新しい公平性の概念として結果的公平性を紹介し,その制約を設けた順次意思決定問題を取り扱う.結果的公平性は,ほとんど確実に公平性が満たされることを要求する.具体的には,有限回の意思決定を行った結果,不公平な決定が与えられた閾値$eta$をほとんど確実に超えないことを要求する.本稿でははじめに,敵対的文脈における不可能性を示し,この問題が本質的に難しいことを示す.有意義な結果は,分配的文脈設定において得られる.この設定において,$O(max{ln T,min{eta,T/eta}})$のレグレットを達成するアルゴリズムFairUcbを紹介し,$eta le o(ln T)$であるときにはこのレグレットが最適であることを示す. |
(英) |
Fairness in machine learning is being recognized as an important field. It requires that the consequent decisions made by a machine learning algorithm must not be biased on the sensitive attributes of individuals. In this paper, we introduce a novel notion of fairness, consequential fairness, and deal with sequential decision-making problems with a consequential fairness constraint. Consequential fairness requires almost sure satisfaction of fairness, that is, the number of unfair decisions does not exceed a prescribed threshold, $eta$, almost surely after a finite number of decisions. We first show a impossibility result for the adversarial context, which implies fundamental hardness of the setting. Meaningful results are obtained under the allocative contexts. We show that a novel algorithm, FairUcb, can achieve $O(max{ln T,min{eta,T/eta}})$ regret under a mild assumption. We also show that this regret bound is optimal up to constant if $eta le o(ln T)$. |
キーワード |
(和) |
公平性 / 差別 / 文脈付きバンディット / ギャップ依存レグレット / 敵対的文脈 / 分配的文脈 / / |
(英) |
fairness / discrimination / contextual bandits / gap-dependent regret / adversarial contexts / allocative contexts / / |
文献情報 |
信学技報, vol. 117, no. 293, IBISML2017-53, pp. 139-146, 2017年11月. |
資料番号 |
IBISML2017-53 |
発行日 |
2017-11-02 (IBISML) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
IBISML2017-53 |