留存率,在数据分析中,我认为是一个比较好用的指标,因为比较稳定,不会很容易受外界因素的干扰,大幅波动。例如活动,推广等。可以用来做用户的分类,做用户规模预测。
我们看到的留存曲线通常是这样的:
这里介绍几种留存率曲线拟合的方法:
1.用excel 拟合:
拟合样本,1日~12日留存率,画好曲线图后,为曲线图添加趋势线,选择对数或者幂函数(通常对数比较多),显示公式和R平方值,R平方值越接近1,说明拟合效果越好。
如下图,蓝色曲线为真实值,拟合的橙色点线和真实值还是有差异,但效果还是不错的。
y=-0.055ln(x)+0.6382, R平方=0.9894
2.SPSS拟合
操作:R1: [1,2,3,...,12], R2 为对应的12个留存率,选择: 分析-回归-曲线估计,因变量=R2,自变量-变量=R1, 模型=对数, 保存:选预测值,残差,预测区间 - 确定 即可。
y=-0.61ln(x)+0.630 , R平方=0.975

留存率是数据分析中的稳定指标,用于用户分类和规模预测。本文介绍了使用Excel、SPSS和Python进行留存率曲线拟合的方法,通过对比不同拟合效果,展示如何评估拟合优度。

1万+

被折叠的 条评论
为什么被折叠?



