别再只做AB实验了！用Python实战倾向性得分匹配（PSM）搞定观察性研究中的因果推断

最新推荐文章于 2026-05-13 09:24:22 发布

原创

最新推荐文章于 2026-05-13 09:24:22 发布 · 442 阅读

标签

#因果推断 #倾向性得分匹配 #Python #数据分析

收录于

用Python实战倾向性得分匹配：破解观察性数据的因果推断难题

当市场团队兴奋地展示上季度促销活动带来25%销售额增长时，作为数据科学家的你该如何判断这个数字的真实性？在无法进行随机分组实验的商业场景中，倾向性得分匹配（PSM）成为了解开因果谜题的金钥匙。本文将带你用Python从零实现PSM全流程，揭示隐藏在观察性数据背后的真实因果效应。

1. 为什么观察性数据需要特殊处理？

医疗领域有个经典案例：统计数据显示定期体检的人群平均寿命反而比不体检人群短。这个反常识的结论背后，是体检行为与健康状况的复杂纠缠——身体状况较差的人更可能主动体检。这种由于混杂变量（Confounder）导致的虚假关联，在商业数据分析中同样常见。

观察性数据与实验数据的本质差异在于：

实验数据：通过随机分配确保处理组和对照组可比性（如A/B测试）
观察性数据：处理分配非随机，组间存在系统性差异（如高价值客户更可能收到优惠券）

下表展示了某电商促销活动的原始数据问题：

指标	处理组（收到优惠券）	对照组（未收到）	差异
转化率	18%	9%	+9%
历史购买频次	5.2次	3.1次	+2.1次
客单价	¥320	¥210	+¥110

关键洞察：直接比较会高估促销效果，因为处理组本就是高价值用户

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_30788239

关注关注

3
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

让我康康是谁还不会用PSM

fff2zrx的博客

11-30

2252

为了验证因果效应，最直接有效的就是做AB实验。一组保持原状，另一组做出对应改变，如果两组的差异超出了正常数据波动范围，我们就认为两组的差异是这个改变所引起的，差异就是因果效应。但是呢，很多时候我们出于各种原因，无法做严格的AB实验，只能基于观察数据验证因果效应。此时就是因果推断的用武之地了。。

参与评论您还未登录，请先登录后发表或查看评论

别再只做AB实验了！用Python实战因果推断：倾向性得分匹配（PSM）完整代码与避坑指南

weixin_42537919的博客

05-02

399

本文详细介绍了如何利用Python实现因果推断中的倾向性得分匹配（PSM）技术，解决传统AB测试在非随机数据中的偏差问题。通过完整的代码示例和五步实战法，帮助数据科学家从数据准备到效果评估全面掌握PSM应用，并提供了业务场景中的五大陷阱与解决方案，提升因果推断的准确性和可靠性。

(python3)1076. Wifi密码 (15分)——2017-12考题

xutiantian1412的博客

12-17

1577

题目介绍：本题就要求你写程序把一系列题目的答案按照卷子上给出的对应关系翻译成wifi的密码。这里简单假设每道选择题都有4个选项，有且只有1个正确答案。输入格式：输入第一行给出一个正整数N（输出格式：在一行中输出wifi密码。输入样例： 8 A-T B-F C-F D-F C-T B-F A-F D-F A-F D-F C-F B-T B-T A-F

1076 Wifi密码 (15 分)

yubai258的博客

05-24

592

#include<iostream> #include<string> #include<stdio.h> using namespace std; int main() { int n; cin >> n; string word; getchar(); for (int i = 0; i...

PTA:7-80 Wifi密码 (15分)

zlzhujust@gmail.com

01-16

5648

7-80 Wifi密码 (15分) 下面是微博上流传的一张照片：“各位亲爱的同学们，鉴于大家有时需要使用 wifi，又怕耽误亲们的学习，现将 wifi 密码设置为下列数学题答案：A-1；B-2；C-3；D-4；请同学们自己作答，每两日一换。谢谢合作！！~”—— 老师们为了促进学生学习也是拼了…… 本题就要求你写程序把一系列题目的答案按照卷子上给出的对应关系翻译成 wifi 的密码。这里简单假设每道...

k8s重启报错：The connection to the server 192.168.102.149:6443 was refused

任我行的博客

10-27

2万+

现象 k8s重启报错 # kubectl get pods The connection to the server xxx:6443 was refused - did you specify the right host or port? 问题排查根据报错描述，连接kubelet的6443端口被拒绝：查看该端口状态显示端口未启动起来 ss -antulp | grep :6443 该端口是kubelet的api监听端口，应该是kubelet启动失败，尝试重启，查看kubelet状态，果然启动失

k8s: the connection to the server 192.168.2.94:6443 was refused 解决方法

xuxuxu1222的博客

08-05

2万+

现象：安装完成k8s服务之后，kubectl get pods的时候报错，提示如下： the connection to the server 192.168.2.94:6443 was refused - did you specify the right host or port? 原因：由于系统中的根目录下的磁盘空间不足，导致k8s调度docker去启动apiServer失败！解决方...

python倾向匹配得分_数据分析36计(九)：倾向得分匹配法(PSM)量化评估效果分析

weixin_39963053的博客

11-29

1553

1. 因果推断介绍如今量化策略实施的效果评估变得越来越重要，数据驱动产品和运营、业务等各方的理念越来越受到重视。如今这方面流行的方法除了实验方法AB testing外，就是因果推断中的各种观察研究方法。“统计相关性并不意味着因果关系”，数据分析工作经常遇到归因分析问题，又因为种种原因而无法进行AB testing直接随机分组实验比较结果。举一些例子：在 feeds 流里刷到一个新推荐策略的内容的用...

别再只做AB测试了！用Python实战倾向性得分匹配(PSM)，搞定业务中的因果推断难题

热门推荐

一定要站在自己热爱的生活里闪闪发光

02-27

3万+

下面是微博上流传的一张照片：“各位亲爱的同学们，鉴于大家有时需要使用 wifi，又怕耽误亲们的学习，现将 wifi 密码设置为下列数学题答案：A-1；B-2；C-3；D-4；请同学们自己作答，每两日一换。谢谢合作！！~”—— 老师们为了促进学生学习也是拼了…… 本题就要求你写程序把一系列题目的答案按照卷子上给出的对应关系翻译成 wifi 的密码。这里简单假设每道选择题都有 4 个选项，有且只有 1...

The connection to the server 192.168.229.131:6443 was refused - did you specify the right host or po

qq_21277357的博客

11-30

6742

虚拟机关机后,k8s出现这个问题,查看日志输入命令:journalctl -xefu kubelet 会看到下面的报错日志信息 --cgroups-per-qos enabled, but --cgroup-root was not sp 输入:swapoff -a 在查看k8s 重启成功

Kubernetes-kubectl命令出现错误【The connection to the server localhost:8080 was refused - did you specif...

5G MEC边缘计算

08-07

1402

今天在Kubernetes的从节点上运行命令【kubectl】出现了如下错误 [root@k8snode1 kubernetes]# kubectl get pod The connection to the server localhost:8080 was refused - did you specify the right host or port? 出现这个问题的原因是kubectl命令需要使用kubernetes-admin来运行，解决方法如下，将主节点中的【/etc/kuberne

反复出现：The connection to the server x..x:6443 was refused - did you specify the right host or

qq_38359135的博客

10-12

8483

在所有节点重启kubelet试试： sudo systemctl restart kubelet.service

1076 Wifi密码 (15 分)

韩旭051的博客

08-16

5101

1076Wifi密码(15分) 下面是微博上流传的一张照片：“各位亲爱的同学们，鉴于大家有时需要使用 wifi，又怕耽误亲们的学习，现将 wifi 密码设置为下列数学题答案：A-1；B-2；C-3；D-4；请同学们自己作答，每两日一换。谢谢合作！！~”—— 老师们为了促进学生学习也是拼了…… 本题就要求你写程序把一系列题目的答案按照卷子上给出的对应关系翻译成 wifi 的密码。这里简单假设...

PAT（乙级）1076 Wifi密码（15 分）

CuriousLiu的博客

07-12

1421

也是好久不做题拿来练练手感，有个问题是PAT上好像突然在C++的语言选择中用不了gets了，不知道是什么原因一直编译错误，但是切换到C就可以通过（因为是一组字符串的输入中含有空格所以需要使用gets）题目链接#include <stdio.h> #include <string.h> //这道题留下了一个没有解决的问题，为什么在pat上使用g++编译，gets会报错？ i...

1076 Wifi密码（15 分）

潮流 M I 的博客

07-25

4207

1076 Wifi密码（15 分）

weixin_33840661的博客

03-07

376

#include<bits/stdc++.h> using namespace std; int a[5]; int main() { int i,n,j; a['A']=1;a['B']=2;a['C']=3;a['D']=4;a['E']=5; scanf("%d",&n); getchar(); for(i=0...

PTA 7-2 输出整数各位数字

LeoPhilo的博客

11-15

1万+

本题要求编写程序，对输入的一个整数，从高位开始逐位分割并输出它的各位数字。输入格式：输入在一行中给出一个长整型范围内的非负整数。输出格式：从高位开始逐位输出该整数的各位数字，每个数字后面有一个空格。输入样例： 123456 输出样例： 1 2 3 4 5 6 #include #include int main(){ int a,