论文结构化摘要:Fair Wasserstein Coresets (FWC) —— 公平的Wasserstein核心集
1. 核心研究问题 (PICO/T)
-
P (问题/群体): 大规模数据集上,为下游机器学习任务生成小规模代表性样本(核心集/数据蒸馏)时,现有方法忽略了数据中固有的子群偏见。虽然已有一些公平聚类方法能在局部层面(如聚类内保持比例)产生公平代表点,但这些代表点对下游学习任务的公平性-效用权衡的影响尚不明确。
-
I (干预/新方法): 提出 FWC ( Fair Wasserstein Coresets),一种新型核心集方法,能够:
- 生成合成代表样本(而非从原始数据中选取)。
- 为每个样本分配权重,用于下游加权训练。
- 通过最小化加权合成样本分布与原始数据集分布之间的Wasserstein距离来保持分布相似性。
- 同时使用线性约束强制执行人口统计平等(Demographic Parity) 的实证版本。
订阅专栏 解锁全文

859

被折叠的 条评论
为什么被折叠?



