基础概念
replid:数据集的id,表示是哪一个数据集的。
offset:偏移量,记录服务同步数据到哪个地方。
repl_baklog:循环缓存数组,记录主机写的操作命令,主机和从机进行数据同步,主机将循环数组的数据发送给从机,从机执行同步数据。
全量同步
什么是全量同步
同步所有的数据。
什么时候进行全量同步
在主从节点进行第一次数据同步的时候,或者从节点宕机,主机数据覆盖了从机未同步的数据。
流程是什么
第一部分:
- 从机向主机发起建立连接消息,发送replid和offset
- 主机判断是不是第一次同步(replid一致即第一次同步)
- 如果是发送数据集版本号给从机(replid和offset)
- 从机接收到数据之后进行保存
第二部分:
- 主机执行bgsave生成RDB文件
- 主机发送文件
- 从机接收到文件,删除原来数据,执行文件
- 主机记录生成RDB文件之间执行的所有写命令到repl_baclog
第三部分:
发送repl_baclog中的命令到从机
从机执行备份

全量同步有什么问题
全量同步生成RDB文件,在将文件通过网络传输到从机,消耗太大。
增量同步
什么是增量同步
同步主节点和从节点之间差异的部分。
什么时候做增量同步
在第一次同步之后,大部分的同步做增量同步,第一次同步之后,增量同步也是持续的。
增量同步的流程
第一部分:
- 从机向主机发送消息建立连接,发送replid和offset
- 从机判断是不是同一个数据集,是不是第一次
- 如果是同一个数据集,不是第一次,继续
第二部分:
- 主机向从机发送offset之后的数据
- 从机介绍到数据执行同步数据

优化
- 在master中配置repl-diskless-sync yes启用无磁盘复制,避免全量同步时的磁盘IO。
- Redis单节点上的内存占用不要太大,减少RDB导致的过多磁盘IO
- 适当提高repl_baklog的大小,发现slave宕机时尽快实现故障恢复,尽可能避免全量同步
- 限制一个master上的slave节点数量,如果实在是太多slave,则可以采用主-从-从链式结构,减少master压力
参考黑马

687

被折叠的 条评论
为什么被折叠?



