本文主要对以下指标的计算和解释进行阐述,并使用案例说明,最后利用python编写代码进行计算:
- risk ratios and rate ratios(风险比率和比率比率,RR)
- risk difference and rate difference(风险差异和利率差异, RD)
- attributable proportion (attributable risk percent) for the exposed(风险承担的可占比例(可归属风险百分比), AP)
- population attributable risk(人口归因风险,PAF)
- odds ratio(比率, OR)
我们使用的案例如下,假设一种产品来源于两个营销渠道,我们记录了每个渠道的转化人数和未转化人数(转化可以定义为点击、充值等)
| 营销渠道 | 转化 | 未转化 | 求和 | 转化率 |
|---|---|---|---|---|
| 渠道A | 159 | 2841 | 3000 | 159/3000=5.30% |
| 渠道B | 46 | 3454 | 3500 | 46/3500=1.31% |
| 总计 | 205 | 6295 | 6500 | 205/6500=3.15% |
归因分析指标计算
1:计算Risk Ratio(风险比率)、Rate Ratio(比率)
Risk Ratio(风险比率)通常也称为Rate Ratio(比率),表示一个相对于一个因素B,另一个因素A条件下转化率相对于因素B的转化率的倍数(A,B可以理解为实验组和对照组)。

其中CIeCI_eCIe是渠道A的转化率,CIuCI_uCIu是渠道B的转化率。
| 营销渠道 | 转化 | 未转化 | 求和 | 转化率 |
|---|---|---|---|---|
| 渠道A | 159 | 2841 | 3000 | 159/3000=5.30% |
| 不暴露 | 46 | 3454 | 3500 | 46/3500=1.31% |
| 总计 | 205 | 6295 | 6500 | 205/6500=3.15% |
Risk Ration(RR) = 5.30%/1.31% = 4.04
解释:渠道A的转化率是不暴露组的转化率的4.04倍(Risk Ration(RR)=4.04),同时认为渠道A的转化率相比于比不暴露组的转化率提升了了404%-100%=304%(此处含义是以B为基准,相对的含义)
结论:
- 相对不暴露组的转化率而言,渠道A的转化率是不暴露组的4.04倍
- 相比于不暴露组而言,渠道A的转化率相对于B的转化率提升了304%(并不转化率是真的提升304%,而是在B的基础上提升了304%的B的转转化率)
若我们有多组实验,可以用同样的方法计算
2:计算Risk Difference(风险差异)、Rate Difference(比率差异)
Risk Difference(风险差异)也被称为Rate Difference(比率差异)

其中CIeCI_eCIe是渠道A的转化率,CIuCI_uCIu是不暴露组的转化率。Risk Difference(风险差异)的理解非常直观。就是直观的两个渠道转化率的差异。
由RR与RD的公式可知两者的转换关系为:
RD/CIu=RR−1RD/CI_u=RR-1RD/CIu=RR−1
利用上面例子的数据,计算出RD = 5.30%-1.31%=3.99%。代表了渠道A去渠道B的转化率差异为3.99%。
Risk Ratio与Risk Difference的出发角度不同,Risk Ratio衡量的是
渠道A相对于不暴露组提升了多少,可用于衡量改进的效果,而Risk Difference直接衡量了转化率(收益)提升了多少。Risk Ratio是相对的,Risk Difference是绝对的
3:计算Attribution Proportion
Attribution Proportion(归因分数)表示了该渠道人群中有多少是因为该渠道发生转化的。

利用上面数据。计算出
AP=5.30%−1.31%5.30%=75.28%AP = \frac{5.30\%-1.31\%}{5.30\%} = 75.28\%AP=5.30%5.30%−1.31%=75.28%
如果B代表是未参加渠道展示,则对于计算出的归因分数(Attribution Proportion),可以解释如下:渠道A展示的用户中,有75.28%的用户是因为渠道A的展示而发生了转化。
如果我们对Attribution Proportion的分子、分母同时除以CIuCI_uCIu,则Attribution Proportion公式变为如下形式:
AP=RR−1RRAP = \frac{RR-1}{RR} AP=RRRR−1

本文深入解析归因分析中的关键指标,如风险比率(RR)、风险差异(RD)、归因分数(AP)及人口归因分数(PAF),并提供Python代码实现。通过案例研究,展示如何量化营销渠道对转化率的影响。
&spm=1001.2101.3001.5002&articleId=105489474&d=1&t=3&u=d06472ad7bca49ddb45fa41d81981203)
1485

被折叠的 条评论
为什么被折叠?



