-
目录
集群压测基本流程
-
Step1:压测目标制定
-
目标qps(绝大部分的性能问题,都可以通过qps来体现)
-
qps不仅是入口的数值,同时需要关注系统及子系统的性能表现(业务指标+系统指标);
-
压测的目标系统及重要子系统需要有明确的压测熔断指标(业务指标+系统指标);
-
-
-
Step2:压测准备
- 测试query准备:
- 测试query集合类型配比(模拟真实线上请求场景)
- 测试query的特殊标记(方便后期统计或清理)
- 系统架构:
- 测试环境与线上环境服务隔离,若无法隔离则必须要有明确的止损预案
- 上下游实例数量配比检查
- 上下游连接关系检查
- 测试工具准备(优先业界通用,避免自造轮子)
- 观察(监控)指标梳理
- 降级/止损预案准备
- 测试query准备:
-
Step3:预压测
- 压测工具以单实例/较低qps请求服务集群,目的:
- 1)预演整个压测流程;
- 2)分析流量分发到各服务的比例;
- 压测工具以单实例/较低qps请求服务集群,目的:
-
Step4:压测
- 压力应阶段性增长,每个阶段必须要有一定的停留观察时间;
-
Step5:扫尾工作
- 压测日志保存;
- 压测指标曲线图保存;
- 如若有,回滚fake服务;
- 如若有,关闭实验开关;
- 如若有,清理压测流量记录;
-
-
集群压测原则
- 压测前,将压测的流程文档化,以便压测执行过程中查看,尤其对于核心check点/流程务必高亮提示;
- 压测前,务必需要有环境确认的预压测过程,确定环境各部分符合预期;
- 每一步都需要有明确的检查指标,确保测试环境、服务状态符合预期;
- 出现非预期的场景,在无法立即确认问题原因,无法确认问题影响面情况下,应停测试压力,避免持续影响;
本文详细介绍了系统集群压测的基本流程,包括目标制定、压测准备、预压测、正式压测和扫尾工作,并强调了压测过程中应遵循的原则,如文档化流程、环境确认和问题应急处理等。

742

被折叠的 条评论
为什么被折叠?



