RFM模型

目录

✅ 一、RFM模型定义与目标

✅ 二、使用场景与业务应用

✅ 三、数据准备与处理逻辑

1. 数据字段要求(原始交易数据)

2. 数据清洗与预处理建议

3.观察窗 & 评估窗:

✅ 四、R/F/M 变量计算逻辑

1. Recency

2. Frequency

3. Monetary

4.衰减特征(Decay Features)

✅ 五、RFM评分标准与建模方法

1. 分箱(打分)方法,得出RFM Score,并进行分群

2. Kmeans聚类

2.1 流程

2.2 零桶分离

✅ 六、RFM 模型实际应用(AB实验)

1. 实验目标

2. 实验流程(可融合AB测试设计思维)

3. 护栏指标

✅ 七、工程化

✅ 八、进阶口径与多业务形态

✅ 九、RFM模型的优缺点

优势

局限

✅ 十、RFM与生命周期模型


一、RFM模型定义与目标

RFM 模型基于交易与活跃行为,从 R(近因)/F(频次)/M(金额或利润) 量化用户价值。

维度

含义(口径)

作用

R(Recency)

相对快照日 T 的最近一次「关键行为」距今天数(购买/登录/访问,视业务选取)

衡量客户活跃度

F(Frequency)

在观察周期内的消费次数

衡量客户粘性

M(Monetary)

观察窗内的净收益:GMV-退款-补贴(或毛利/贡献利润)

衡量客户价值

“值不值”是 R×F×M 的综合价值,不是单纯 M 值。

核心目标:依据客户行为特征价值进行分群,辅助业务决策(如精准营销、流失预警等)。


二、使用场景与业务应用

用户分群:识别高价值客户、潜在流失客户等

会员运营策略:不同RFM分组匹配差异化促销或激励,分层价格、券梯度、专属服务。

生命周期管理:结合时间轴,判断新客/活跃老客/沉默用户,与 新客→活跃→沉寂→流失 对齐运营节奏。

模型输入特征:作为监督学习或推荐系统的特征


三、数据准备与处理逻辑

1. 数据字段要求(原始交易数据)

用户唯一标识(如 user_id)

订单日期(order_date)

订单金额(order_amount)

可选字段:渠道(channel)、商品分类等维度扩展分析

2. 数据清洗与预处理建议

① 删除重复值

②尝试补全关键字段,如客户ID(通过相同订单查找)。无法补全时删除数据

③排除异常订单(退款、负金额)

④确保时间字段格式统一

⑤明确“当前日期”(通常为数据提取时间或自然月最后一天)

⑥添加总价格列

3.观察窗 & 评估窗

观察窗 [T-90, T] 产出 R/F/M;评估窗 [T, T+30] 观察复购/留存。

任何特征不得使用 [T, T+30] 内的数据(避免时间泄漏)。

  • 观察窗(Observation Window)
    用来计算用户的 R、F、M 特征。例如:取前 90 天的交易数据,统计每个用户的最近一次消费(R)、消费次数(F)、消费金额(M)。这一步是 评估“现在用户值不值” 的基础。

  • 评估窗(Evaluation Window)
    用来验证 RFM 标签是否真的有效。例如:用后 30 天的数据,看不同 RFM 分群在复购率、留存率、ARPU 等指标上的表现差异。相当于检验模型划分的客户群,未来是否真的有差异


四、R/F/M 变量计算逻辑

1. Recency

DATEDIFF(当前日期, MAX(order_date))

2. Frequency

COUNT(DISTINCT order_id) 或 COUNT(order_date)

3. Monetary

SUM(order_amount)

建议使用group by user_id进行聚合计算。

4.衰减特征(Decay Features)

 含义

  • 在计算 F(频次)或 M(金钱)时,可以给最近的行为更高权重,较久远的行为权重更低。

  • 常用方法:指数衰减(exponential decay)

 作用

  • 比“单纯计数/金额”更能体现 近期趋势

  • 提升对未来预测的相关性(最近行为往往更能代表未来表现)。

 实操应用

  • 公式:

    • w = exp(-λ * Δt),Δt 是行为距基准日的天数

    • F_decay = Σ w

    • M_decay = Σ (amount * w)

  • λ 由“半衰期”决定,比如设半衰期 = 30 天,30 天前的交易权重减半。

  • 在 RFM 聚类时,可以用 F_decay 和 M_decay 替代原始 F/M。

例子:

  • 用户 A:过去 3 个月内下单 10 次,但最近 1 周就下了 5 单 → F_decay 很高

  • 用户 B:过去 3 个月内下单 10 次,但最近 2 个月没动 → F_decay 明显更低
    → 两者的未来价值差异就被更好捕捉到。


五、RFM评分标准与建模方法

1. 分箱(打分)方法得出RFM Score并进行分群

分位数法(如五分位:1~5 分)

等距法(自定义区间)

业务规则(如 VIP 客户单独定义高分)

R值

越小分越高

F值/M值

越大分越高

可组合出 125 类(5×5×5),但一般简化为 8~11 类:

金牌客户(555)、忠诚客户(高F高M)、价值流失(高M低R低F)、潜力客户(高R低F低M)、沉默客户(111)

2. Kmeans聚类
2.1 流程

①数据标准化(StandardScaler)

②确定分群数量(簇心数量)(使用肘部法kmeans的inertia_,即SSE,簇内惯性/误差平方和)或者轮廓系数,并考虑运营可执行性(≤12 组)。

③聚类与命名:结合每个簇的质心(R/F/M均值)来解读群体特征:低 R、高 F、高 M 的群体就是典型高价值客户。

④业务指标验证,比如复购率、ARPU 和留存情况,来确认哪些簇是真正的“高价值” 

⑤绘制热力图进行查看不同分群客户的R 、F、 M分布

2.2 零桶分离

含义

  • 在用户数据中,常会有大量 F=0(未消费)或 M=0(金额为0) 的用户。

  • 这些“零值用户”在数量上可能占比很高(零膨胀),如果直接拿去聚类,会严重干扰模型效果。

作用

  • 避免“零值用户”把聚类中心拉偏,使得 KMeans 等方法无法正确识别有价值群体。

  • 让“零值用户”单独作为一个群体(如“未激活/潜客群”),方便针对性策略。

实操应用

  • 规则法:先把 F=0 或 M=0 的用户打上“零桶”标签,单独存储,不参与聚类。

  • 策略应用:对零桶用户通常做新客培育/拉新转化(首单券、任务激励),而不是和老用户混在一起。


六、RFM 模型实际应用AB实验)

实际运营中,可以结合 A/B 实验进行策略验证,确保分群带来的效果真实有效:

1. 实验目标

为不同RFM群体设置差异化运营动作,验证RFM模型指导的分群是否带来转化提升

2. 实验流程(可融合AB测试设计思维)

阶段

内容

埋点设计

采集用户行为数据,确保订单与用户绑定

数据切分

选定实验周期、用户范围(正交分流)、去除新注册等干扰因素

RFM计算

构建实验组和对照组的RFM画像

策略匹配

实验组按RFM匹配不同运营策略,对照组统一策略

指标效果监测

ROI、点击率、复购率、转化率等业务指标

显著性检验

使用Z检验、T检验等方法确认差异是否显著

闭环复盘

分析分群逻辑、策略匹配及效果,监控体系、更新标签体系

3. 护栏指标

 含义

  • 在 AB 实验或策略落地时,除了主要关注指标(如复购率、转化率),还会设一些“护栏指标”。

  • 护栏指标指那些 不希望因策略优化而恶化的指标

 作用

  • 防止“优化一面,损害另一面”。

  • 确保策略的综合健康性。

 实操应用

  • 在验证 RFM 分群营销时,除了看转化/ROI,还要监控:

    • 退款率(避免刺激促销导致退货)

    • 客户投诉率(避免高频打扰引发反感)

    • 营销成本率(优惠券/补贴比例过高)

  • 如果护栏指标突破阈值,即使主指标上升,也要 降频或停止策略


七、工程化

·  每天自动跑:近90天的订单数据 → 算出每个用户的 R/F/M。T+1 日常跑 R/F/M 与分群;月度/季度重训聚类模型。

·  模型打标签:用最新模型把用户分到簇(如高价值、潜力、流失)。

·  结果存表:输出到一张user_segments表,含日期和版本号。

·  监控报警:占比异常/数据缺失就发消息。数据新鲜度、各簇占比漂移、质心漂移、指标基线异常。

·  运营使用:特征口径/模型/阈值全版本化,直接在系统里调这个表推送营销。

·  冷启动处理:新客用 Tenure(注册时长)/V(访问/时长) 单独打标签与策略池。

工程化就是把“RFM 一次性分析”变成“自动、稳定、可回溯的分群服务”。核心做法有 定期调度、监控告警、版本追溯、可解释规则、冷启动处理。这样既让数据分析更靠谱,也让运营能放心长期用。


✅ 八、进阶口径与多业务形态

·  订阅业务:R=距上次扣费;F=账期数;M=MRR/ARR/毛利。

·  跨品类/渠道:先品类内 RFM→标准化后加权合成用户级:

M_weighted = Σ_c (w_c * M_c);权重可用毛利率/战略优先级

·  时间衰减(更稳健):引入指数衰减权重(半衰期 h):

w = exp(-ln2 * Δt / h);F_decay = Σ w,M_decay = Σ amount * w。


、RFM模型的优缺点

优势

简单直观,业务人员容易理解

无需监督标签,可做非监督式聚类分群

与业务深度契合,解释性强

局限

忽略行为时间序列(如订单间隔趋势)

无法识别新用户

对于F、M分布极度偏态的数据敏感(Kmeans一定程度可避免)

分群逻辑静态,需定期复算更新(Kmeans一定程度可避免)


RFM与生命周期模型

·  RFM 评“值不值”生命周期评“活不活”

 典型阶段:新客(<7 天)/活跃(30 天内有行为)/沉寂(30–90 天无行为)/流失(>90 天)。

·  输出二维标签迁移矩阵(阶段转移概率),策略按时机×强度匹配:

高价值×临流失 → 强干预召回

中价值×新客 → 教育/首单激励

低价值×活跃 → 轻运营或内容引导

·  RFM 模型和生命周期模型,构建了一套动态的用户分群体系。

RFM评估用户价值,生命周期判断用户活跃状态,最终形成二维用户标签体系。并结合AB实验,针对不同类型客户采取针对性的营销策略。

·  生命周期模型本质上是对 RFM 模型中 R(Recency)维度的一种时间段式、状态迁移式的延展。

R 值只衡量“最近是否活跃”,而生命周期模型则更进一步地定义了新用户、活跃期、沉寂期、流失期等行为状态,强调行为的时序连续性和阶段变化,因此它更适用于动态人群管理、运营时机把控等场景。二者结合能更好地同时兼顾用户“活跃度”和“价值度”的精细运营。


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值