线上Redis内存暴涨问题排查

原创

已于 2024-07-05 09:47:32 修改 · 1.1k 阅读

·

5

·

标签

#redis #缓存

于 2024-07-05 00:51:12 首次发布

背景：

某证券公司APP业务，使用了腾讯云的云数据库redis（TencentDB for Redis）集群版本，2024.6.20运维童鞋反馈，近几周redis的内存量增长很快，日均增加2%，redis集群已经接近80%使用内存（图片待补充）

在这里插入图片描述

排查过程：

排查内存暴涨原因：
腾讯云提供的运维平台只能看出来某些bigkey，但咨询业务开发后发现该bigkey的数量可控，不会是引起内存暴涨的原因。
在这里插入图片描述
腾讯云运维平台，无法根据key前缀显示内存大小，此时无法定位到是哪些key引起的，问题卡在这里。

新的排查思路：

（1）根据运维反馈，是最近几周redis才开始出现内存暴涨问题，猜测可能原因是最近几周新上的某些业务写入了很多用户维度的key。
（2）如果我们能登录到某个redis存储节点上，用scan指令查看是否有大量相同前缀的key，或许就能够找到一些思路。
（3）顺着这个思路，结合之前关于redis集群的相关知识储备，在集群模式下，redis客户端会拿到集群下所有的node节点，维护所有的分片node（16384槽位的一部分）的ip，然后针对该ip进行读写操作。因为生产环境执行scan指令比较危险，所以打算复刻一份数据到测试环境进行检测
（4）运维下载生产的RDB文件，整库备份到测试环境的redis中
（5）登录到r

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。