写在前面:现在实习又开始做选券,公司目前是Uplift+multi_treatment方式去评估派不同的券对消费者的因果效应。加上之后毕业论文也要做因果机器学习,所以打算也更新一下因果方向的一些知识,一起学习!!
首先,如果接触过因果机器学习,那肯定听过双重机器学习(Double Machine Learning, DML)和 Uplift 模型。但是我们要知道,这是两种不同的方法,尽管它们都涉及因果推断,但它们的目标、应用场景和实现方式存在显著差异。
1.1. 核心目标
双重机器学习 (DML)
- 目标: 估计总体或条件平均处理效应(ATE 或 CATE),即干预变量对结果变量的因果效应。
- 关注点: 在存在混杂变量的情况下,控制混杂因素的影响,从而提供无偏的因果效应估计。
- 适用场景:
- 医疗领域:评估某种药物对患者整体效果的影响。
- 经济学研究:分析政策变化对经济指标的整体影响。
Uplift 模型
- 目标: 估计个体层面的增量效应(Uplift),即干预措施对每个个体行为的净影响。
- 关注点: 找到哪些个体对干预最敏感(可说服者),从而优化资源分配。
- 适用场景:
- 营销领域:识别哪些客户会对促销活动产生反应。
- 社会科学:评估教育干预对学生个体表现的差异性影响。
1.2. 因果效应的定义
双重机器学习
- 因果效应: 关注的是 总体因果效应 或 条件平均因果效应。
- ATE (Average Treatment Effect): 干预组与对照组之间的平均差异。
- CATE (Conditional Average Treatment Effect): 在某些条件下(如协变量特定值)的平均因果效应。
Uplift 模型
- 因果效应: 关注的是 个体层面的增量效应。
- Uplift = Y1−Y0Y_1 - Y_0Y


2万+

被折叠的 条评论
为什么被折叠?



