电信用户流失分析:基于MySQL的数据洞察
在通信行业,获客成本持续攀升的今天,维系现有用户远比开拓新市场更具性价比。一个看似不起眼的26%流失率,背后可能意味着每年数千万收入的无声蒸发。更关键的是,这些离开的用户往往不是随机分布的——他们集中在某些特定群体、使用某些特定服务、遵循某种行为模式。
如果我们能提前识别这些“高危信号”,是否就能在用户点击注销按钮前,递上一份恰到好处的挽留方案?本文将带你深入一个真实的电信用户数据集,用MySQL一步步揭开流失背后的结构性动因。没有复杂的建模,只有扎实的查询与洞察,目标明确:从数据中找出那些可干预、可执行的关键节点。
数据准备:让原始记录“活”起来
项目使用的数据来自Kaggle上的《Telco Customer Churn》公开数据集,包含7043条客户记录和21个字段,覆盖了用户属性、服务订阅、账单信息及最终的流失标签(Churn)。整个分析在MySQL 8.0环境中完成,通过Navicat进行交互操作。
字段速览(部分关键字段)
| 字段名 | 含义 |
|---|---|
customerID | 客户唯一标识 |
gender | 性别 |
SeniorCitizen | 是否为老年人(1/0) |
Partner, Dependents | 婚姻与家庭状况 |
tenure | 入网月数(0–72) |
InternetService | 网络类型(DSL/Fiber optic/No) |
Contract | 合约类型(月付/一年/两年) |
PaymentMethod | 支付方式 |
MonthlyCharges, TotalCharges | 月费与累计消费 |
Churn | 是否流失(Yes/No) |
数据清洗:处理那11个“异常”用户
原始数据中,有11条记录的 TotalCharges 为空:
SELECT * FROM telco_churn
WHERE TotalCharges = '' OR TotalCharges IS NULL;
进一步观察发现,这些用户都有一个共同点:tenure = 0,即当月入网。逻辑上讲,刚入网尚未产生累计消费是合理的。但为了后续分析统一性(尤其是涉及 TotalCharges 的分组计算),我们做如下处理:
- 将
tenure从0改为1(视为已使用一个月) - 将
TotalCharges初始化为MonthlyCharges
UPDATE telco_churn
SET tenure = 1,
TotalCharges = MonthlyCharges
WHERE TotalCharges = '' OR TotalCharges IS NULL;
此外,检查主键 customerID 无重复,各分类字段取值规范,数据整体质量良好,可进入分析阶段。
流失全景:谁在离开?为什么?
先看一眼全局情况:
SELECT
Churn,
COUNT(*) AS count,
ROUND(COUNT(*) * 100.0 / 7043, 2) AS percentage
FROM telco_churn
GROUP BY Churn;
结果清晰:
- 未流失(No):5174人,占比73.46%
- 已流失(Yes):1869人,占比26.54%
这个数字不算低。接下来,我们从四个维度层层拆解:用户特征、服务行为、合同支付、消费水平,寻找高流失群体的共性。
用户画像:年龄、家庭比性别更重要
性别影响微乎其微
SELECT
gender,
AVG(CASE WHEN Churn = 'Yes' THEN 1 ELSE 0 END) AS churn_rate
FROM telco_churn
GROUP BY gender;
男女流失率分别为25.7%和27.3%,差异极小。说明在通信服务选择上,性别并非决策关键因素。
老年用户风险突出
SELECT
SeniorCitizen,
COUNT(*) AS cnt,
AVG(CASE WHEN Churn = 'Yes' THEN 1 ELSE 0 END) AS churn_rate
FROM telco_churn
GROUP BY SeniorCitizen;
- 非老年用户(84%):流失率23.6%
- 老年用户(16%):流失率高达41.7%
近一半的老年用户在考察期内流失,这是一个危险信号。可能原因包括:对新技术不适应、客服响应不及时、套餐复杂难理解等。
家庭结构决定稳定性
-- 有无伴侣
SELECT Partner, AVG(Churn = 'Yes') AS churn_rate FROM telco_churn GROUP BY Partner;
-- 有无家属
SELECT Dependents, AVG(Churn = 'Yes') AS churn_rate FROM telco_churn GROUP BY Dependents;
| 维度 | 类型 | 流失率 |
|---|---|---|
| 伴侣 | 无 | 47% |
| 有 | 19% | |
| 家属 | 无 | 31% |
| 有 | 14% |
没有伴侣的用户流失率是有的2.5倍;有家属的用户流失率仅为无家属者的一半。这说明社会绑定越强,用户越稳定。家庭责任天然提高了转换成本。
服务使用:光纤快,但人心不稳
入网时长是“黄金指标”
先看平均在网时长:
SELECT AVG(tenure) FROM telco_churn; -- 32.37个月
按是否高于平均值分组:
SELECT
CASE WHEN tenure > 32.37 THEN 'High_tenure' ELSE 'Low_tenure' END AS group,
AVG(Churn = 'Yes') AS churn_rate
FROM telco_churn
GROUP BY group;
- 低时长用户(<32月):流失率47%
- 高时长用户(≥32月):流失率仅7%
这意味着:新用户的流失风险是老用户的6倍以上。前半年是留存的关键窗口期。
网络类型暴露服务质量短板
SELECT
InternetService,
AVG(Churn = 'Yes') AS churn_rate
FROM telco_churn
WHERE InternetService != 'No'
GROUP BY InternetService;
| 网络类型 | 流失率 |
|---|---|
| DSL | 18% |
| Fiber optic | 42% |
光纤用户流失率是DSL用户的2.3倍!这很反直觉——更快的网络反而留不住人?
深入看附加服务:
SELECT
StreamingTV,
AVG(Churn = 'Yes') AS churn_rate
FROM telco_churn
WHERE InternetService != 'No'
GROUP BY StreamingTV;
同样,订购流媒体电视或电影的用户,流失率比未订购者高出15个百分点。
推测:用户因高速网络+丰富内容而来,但实际体验可能未达预期(如卡顿、片源少),导致期望落差更大,反而加速流失。
服务组合揭示用户依赖强度
构建组合变量:
SELECT
CASE
WHEN PhoneService='Yes' AND InternetService='No' THEN 'Phone Only'
WHEN PhoneService='No' AND InternetService!='No' THEN 'Internet Only'
WHEN PhoneService='Yes' AND InternetService!='No' THEN 'Both'
ELSE 'None'
END AS combo,
AVG(Churn = 'Yes') AS churn_rate
FROM telco_churn
GROUP BY combo;
| 组合类型 | 流失率 |
|---|---|
| Phone Only | 16% |
| Internet Only | 42% |
| Both | 35% |
纯互联网用户最不稳定。说明仅靠网络服务难以建立强粘性,而语音+网络的捆绑更能锁定用户。
合同与支付:灵活性越高,忠诚度越低
合约周期是“定海神针”
SELECT
Contract,
AVG(Churn = 'Yes') AS churn_rate
FROM telco_churn
GROUP BY Contract;
| 合约类型 | 流失率 |
|---|---|
| Month-to-month | 49.6% |
| One year | 11.3% |
| Two year | 2.8% |
按月付费的用户几乎每两人就走一个,而两年合约用户几乎全员留存。合约长度直接决定了用户去留。
支付方式反映用户习惯
SELECT
PaymentMethod,
AVG(Churn = 'Yes') AS churn_rate
FROM telco_churn
GROUP BY PaymentMethod;
| 支付方式 | 流失率 |
|---|---|
| Electronic check | 45% |
| Mailed check | 19% |
| Bank transfer (automatic) | 17% |
| Credit card (automatic) | 15% |
使用电子支票的用户流失最严重,而自动扣款(银行转账、信用卡)最为稳定。
解读:需要手动操作的支付方式,用户参与度高,也更容易在缴费时重新评估是否续订;而自动扣款则形成“无感续费”,黏性更强。
无纸账单用户更“善变”
SELECT
PaperlessBilling,
AVG(Churn = 'Yes') AS churn_rate
FROM telco_churn
GROUP BY PaperlessBilling;
- 是:33%
- 否:16%
偏好无纸账单的用户更数字化、更灵活,但也意味着更低的心理绑定和更高的转换意愿。
消费行为:价格敏感区在哪里?
月费区间分析
将 MonthlyCharges 分为四段:
SELECT
CASE
WHEN MonthlyCharges < 34.9 THEN '[0, 34.9)'
WHEN MonthlyCharges < 64.7 THEN '[34.9, 64.7)'
WHEN MonthlyCharges < 88.1 THEN '[64.7, 88.1)'
ELSE '[88.1, max]'
END AS bracket,
AVG(Churn = 'Yes') AS churn_rate
FROM telco_churn
GROUP BY bracket
ORDER BY MIN(MonthlyCharges);
| 月费区间(元) | 流失率 |
|---|---|
| [0, 34.9) | 16% |
| [34.9, 64.7) | 26% |
| [64.7, 88.1) | 43% ← 峰值 |
| ≥88.1 | 36% |
64.7–88.1元是流失重灾区。这类用户已脱离低价套餐,但又未达到“高端尊享”级别,最容易产生“性价比不满”。
累计消费验证“时间价值”
按 TotalCharges 四分位分组:
SELECT
NTILE(4) OVER (ORDER BY TotalCharges) AS quartile,
MIN(TotalCharges), MAX(TotalCharges),
AVG(Churn = 'Yes') AS churn_rate
FROM telco_churn
GROUP BY quartile;
| 分位 | 累计消费范围 | 流失率 |
|---|---|---|
| Q1(最低) | <757.7 | 47% |
| Q2 | 757.7–2279.7 | 26% |
| Q3 | 2279.7–4804.3 | 17% |
| Q4(最高) | ≥4804.3 | 7% |
消费越多、在网越久,流失率越低。这再次印证:用户粘性随时间指数级增长,早期留存是长期价值的前提。
从洞察到行动:可落地的运营建议
数据分析的终点不是报表,而是策略。基于上述发现,提出以下五项可立即执行的优化方向:
1. 针对高危人群设计专属方案
- 老年人:推出“银发安心包”——简化界面、优先人工客服、赠送基础医疗咨询,降低使用门槛。
- 单身用户:捆绑视频会员、音乐平台等社交娱乐服务,提升生活陪伴感。
2. 提升高流失服务的实际体验
- 光纤网络:加强高峰时段带宽保障,避免“ advertised fast, actual slow”。
- 流媒体内容:引入更多经典影视剧、纪录片资源,满足家庭观看需求,减少内容落差。
3. 推动短期用户向长期合约转化
- 新用户首年8折 + 免费提速,引导签订一年以上合约。
- 推出“季度缴费送流量”活动,替代月付模式,降低频繁决策带来的流失风险。
4. 引导稳定支付方式
- 对绑定自动扣款的用户赠送话费券或积分,形成正向激励。
- 逐步弱化对Electronic Check的支持,减少该渠道的宣传露出。
5. 建立用户忠诚度体系
- 设立“星级用户”制度,按在网时长与消费总额分级。
- 高等级用户享专属客服、免费设备检修、生日礼包等权益,强化归属感。
用户流失从来不是偶然事件,而是多个风险因素叠加的结果。本次分析通过MySQL的逐层探查,揭示了“新用户+光纤+月付+电子支票”这一高流失组合的存在。更重要的是,它证明了即使不依赖复杂模型,仅靠扎实的SQL分析,也能挖掘出极具业务价值的洞察。
真正的数据驱动,不在于工具多先进,而在于能否把“看到的”变成“做到的”。每一次对流失用户的成功挽留,都是对企业长期价值的一次加固。



被折叠的 条评论
为什么被折叠?



