在归因分析中,我们一般都需要计算出每个因子的贡献度是多少,比如产品DAU上升,对年龄段维度进行拆解,看是不同年龄段的用户对DAU上升的贡献度是多少,一般根据指标的类型,计算贡献度的方法也不一样,下面就列出一些常见的归因分析贡献度的计算方法。
目录
2.5、加法-加权占比法:M=A+B+C(纵向对比,分解维度)
1、指标类型
指标类型一般可以直接分为两类,原子指标和复合指标,原子指标就是DAU、GMV这种单值,不依赖其他变量独立统计的指标。复合指标是在原子指标上进行数学计算加工,需要通过两个或多个变量做除法计算的指标,比如购买率=购买人数/浏览商品人数。
2、贡献度计算
2.1、替代法:A/B或者A*B*C类型指标
2.1.1、连环替代法
公式定义:
假设核心经营指标及计算公式为:M = a * b *c,
对比周期指标值为 M1 = a1 * b1 * c1,本期指标值为 M2 = a2 * b2 * c2;本期对比上期的偏移量为 M2 - M1
确定先后替换顺序为:a、b、c,找出最大的核心指标影响因子
先替换a,得到Ma = a2 * b1 * c1,那么因子a对核心指标的影响为 Ha = Ma - M1
再替换b,得到Mb = a2 * b2 * c1,那么因子b对核心指标的影响为 Hb = Mb - Ma
再替换c,得到Mc = a2 * b2 * c2,那么因子c对核心指标的影响为 Hc = Mc - Mb
比较影响因子a、b、c对核心指标的影响值Ha、Hb、Hc的大小,其中各因子的差异值之和等于核心指标差异值(Ha + Hb + Hc = M2 - M1),从而找到影响核心指标最大的因素。
进一步Ha / (M2 - M1)可以表示a指标带来的影响比例大小。跟预期相比,M2 - M1这么大差额由于a指标降低(提升)的影响,对实际总指标M造成了Ha大小的损失(提高)
优势&局限性:
优势:通过上面的拆解可以发现,该方法满足所有下级指标的波动之和等于核心指标的波动,使得波动可以用瀑布图完美呈现。
局限:
● 贡献值的大小与替换顺序强相关,甚至会因为替换顺序的改变影响贡献值的排序结果;虽然理论上可以通过数量指标-质量指标-价值指标的顺序来尽量保证结果的可靠性,但对于大部分产品用户而言并不一定清楚了解内在逻辑并如此配置,会导致结论严谨性受损。
● 无法保证下级指标的贡献度在[-100%,100%]的范围,业务解释性较差
2.1.2、控制替代法
公式定义
控制其他指标不变,替换a指标,得到Ma = a2*b1*c1,那么因子a对核心指标的影响为 Ha = Ma - M1
控制其他指标不变,替换b指标,得到Mb = a1*b2*c1,那么因子b对核心指标的影响为 Hb = Mb - M1
控制其他指标不变,替换c指标,得到Mc = a1*b1*c2,那么因子c对核心指标的影响为 Hc = Mc - M1a指标的贡献度可以计算为:Contri_a = Ha/|Ha|+|Hb|+|Hc|
b指标的贡献度可以计算为:Contri_b = Hb/|Ha|+|Hb|+|Hc|
c指标的贡献度可以计算为:Contri_c = Hc/|Ha|+|Hb|+|Hc|
优势&局限性:
● 替换顺序的影响被消除,无论先替换哪个指标,因子贡献值的组合唯一。
● 每个因子的贡献值均落在[-100%,100%]的范围,业务解释性更强。
● 无法保证各指标影响之和为指标本身偏差。
2.2、加法-直接拆解:M=A+B+C
公式定义
1、基期
,本期
,差额=
2、计算不同因素单独变动带来的影响数:如因素带来的变动
3、总变动
4、确定每个因素的影响占比:

本文介绍了归因分析中常用的计算方法,包括替代法、加法-直接拆解、乘法-log转化等,帮助读者理解如何量化不同因素对核心指标的贡献度。

4534

被折叠的 条评论
为什么被折叠?



