RFM模型

维度	含义（口径）	作用
R（Recency）	相对快照日 T 的最近一次「关键行为」距今天数（购买/登录/访问，视业务选取）	衡量客户活跃度
F（Frequency）	在观察周期内的消费次数	衡量客户粘性
M（Monetary）	观察窗内的净收益：GMV-退款-补贴（或毛利/贡献利润）	衡量客户价值

“值不值”是 R×F×M 的综合价值，不是单纯 M 值。

核心目标：依据客户行为特征价值进行分群，辅助业务决策（如精准营销、流失预警等）。

✅ 二、使用场景与业务应用

用户分群：识别高价值客户、潜在流失客户等

会员运营策略：不同RFM分组匹配差异化促销或激励，分层价格、券梯度、专属服务。

生命周期管理：结合时间轴，判断新客/活跃老客/沉默用户，与 新客→活跃→沉寂→流失 对齐运营节奏。

模型输入特征：作为监督学习或推荐系统的特征

✅ 三、数据准备与处理逻辑

1. 数据字段要求（原始交易数据）

用户唯一标识（如 user_id）

订单日期（order_date）

订单金额（order_amount）

可选字段：渠道（channel）、商品分类等维度扩展分析

2. 数据清洗与预处理建议

① 删除重复值

②尝试补全关键字段，如客户ID（通过相同订单查找）。无法补全时删除数据

③排除异常订单（退款、负金额）

④确保时间字段格式统一

⑤明确“当前日期”（通常为数据提取时间或自然月最后一天）

⑥添加总价格列

3.观察窗 & 评估窗：

观察窗 [T-90, T] 产出 R/F/M；评估窗 [T, T+30] 观察复购/留存。

任何特征不得使用 [T, T+30] 内的数据（避免时间泄漏）。

观察窗（Observation Window）：
用来计算用户的 R、F、M 特征。例如：取前 90 天的交易数据，统计每个用户的最近一次消费（R）、消费次数（F）、消费金额（M）。这一步是 评估“现在用户值不值” 的基础。
评估窗（Evaluation Window）：
用来验证 RFM 标签是否真的有效。例如：用后 30 天的数据，看不同 RFM 分群在复购率、留存率、ARPU 等指标上的表现差异。相当于检验模型划分的客户群，未来是否真的有差异。

✅ 四、R/F/M 变量计算逻辑

1. Recency

DATEDIFF(当前日期, MAX(order_date))

2. Frequency

COUNT(DISTINCT order_id) 或 COUNT(order_date)

3. Monetary

SUM(order_amount)

建议使用group by user_id进行聚合计算。

4.衰减特征（Decay Features）

含义

在计算 F（频次）或 M（金钱）时，可以给最近的行为更高权重，较久远的行为权重更低。
常用方法：指数衰减（exponential decay）。

作用

比“单纯计数/金额”更能体现 近期趋势。
提升对未来预测的相关性（最近行为往往更能代表未来表现）。

实操应用

公式：
- w = exp(-λ * Δt)，Δt 是行为距基准日的天数
- F_decay = Σ w
- M_decay = Σ (amount * w)
λ 由“半衰期”决定，比如设半衰期 = 30 天，30 天前的交易权重减半。
在 RFM 聚类时，可以用 F_decay 和 M_decay 替代原始 F/M。

例子：

用户 A：过去 3 个月内下单 10 次，但最近 1 周就下了 5 单 → F_decay 很高
用户 B：过去 3 个月内下单 10 次，但最近 2 个月没动 → F_decay 明显更低
→ 两者的未来价值差异就被更好捕捉到。

✅ 五、RFM评分标准与建模方法

1. 分箱（打分）方法，得出RFM Score，并进行分群

分位数法（如五分位：1~5 分）

等距法（自定义区间）

业务规则（如 VIP 客户单独定义高分）

R值	越小分越高
F值/M值	越大分越高

可组合出 125 类（5×5×5），但一般简化为 8~11 类：

金牌客户（555）、忠诚客户（高F高M）、价值流失（高M低R低F）、潜力客户（高R低F低M）、沉默客户（111）

2. Kmeans聚类

2.1 流程

①数据标准化（StandardScaler）

②确定分群数量（簇心数量）（使用肘部法kmeans的inertia_，即SSE，簇内惯性/误差平方和）或者轮廓系数，并考虑运营可执行性（≤12 组）。

③聚类与命名：结合每个簇的质心（R/F/M均值）来解读群体特征：低 R、高 F、高 M 的群体就是典型高价值客户。

④业务指标验证，比如复购率、ARPU 和留存情况，来确认哪些簇是真正的“高价值”

⑤绘制热力图进行查看不同分群客户的R 、F、 M分布

2.2 零桶分离

含义

在用户数据中，常会有大量 F=0（未消费）或 M=0（金额为0） 的用户。
这些“零值用户”在数量上可能占比很高（零膨胀），如果直接拿去聚类，会严重干扰模型效果。

作用

避免“零值用户”把聚类中心拉偏，使得 KMeans 等方法无法正确识别有价值群体。
让“零值用户”单独作为一个群体（如“未激活/潜客群”），方便针对性策略。

实操应用

规则法：先把 F=0 或 M=0 的用户打上“零桶”标签，单独存储，不参与聚类。
策略应用：对零桶用户通常做新客培育/拉新转化（首单券、任务激励），而不是和老用户混在一起。

✅ 六、RFM 模型实际应用（AB实验）

实际运营中，可以结合 A/B 实验进行策略验证，确保分群带来的效果真实有效：

1. 实验目标

为不同RFM群体设置差异化运营动作，验证RFM模型指导的分群是否带来转化提升

2. 实验流程（可融合AB测试设计思维）

阶段	内容
埋点设计	采集用户行为数据，确保订单与用户绑定
数据切分	选定实验周期、用户范围（正交分流）、去除新注册等干扰因素
RFM计算	构建实验组和对照组的RFM画像
策略匹配	实验组按RFM匹配不同运营策略，对照组统一策略
指标效果监测	ROI、点击率、复购率、转化率等业务指标
显著性检验	使用Z检验、T检验等方法确认差异是否显著
闭环复盘	分析分群逻辑、策略匹配及效果，监控体系、更新标签体系