Redis主从复制

Redis的可靠性保证第一是Redis的持久化数据不会丢失，第二是提供不间断服务这个可以通过集群保证，将Redis服务做一个集群服务将Redis的数据副本放在不同主机上，就算其中有机器宕机，因为数据副本存在不同的主机中所以整个集群依旧能正常提供服务，这里就会存在一个问题，不同主机上的数据副本如何保持一致的呢？聊数据一致之前需要先了解Redis的集群结构。

Redis的集群结构

Redis的集群结构简单总结就是主从结构、读写分离，结构图如下所示。

Redis为什么采用读写分离呢？其根本原因还是最低代价来保证所有节点的数据基本同步，如果所有的节点都能进行读写操作，那么在任一节点修改数据都需要同步到所有的节点，这时为了保证数据的正确性，势必涉及到加锁等一系列的内存开销，这样对于Redis而言不太友好。

对于主从同步不知道有没有这些疑问，主从节点同步细节到底是怎么样？出现从节点网络异常后续恢复那么这之间的数据能不能同步？带着这些疑问往下看。

主从同步细节

主从连接建立

当我们存在多个Redis实例时，我们可以通过命令指定主从库，这里会有Redis版本差异5.0之前采用的是salveof，5.0之后采用的是replicaof完成主从设置，如下所示

假设存在实例A（IP:10.8.81.171）实例B（IP:10.8.81.172）等多个实例，需要指定实例B为实例A的从节点，就可以在实例B上执行如下命令

replicaof 10.8.81.171 6379

了解完主从连接建立后，就需要知道主从初次建立连接后的具体过程，如下所示。

注意点

replication buffer是从库连接上后，主库创建的一块内存空间。
replication buffer的作用是因为主节点在同步从节点数据时，主线程并不会阻塞所以主线程还能正常的处理读写请求，所以同步过程中的数据需要有一块内存专门记录。
==主从全量复制后会建立一个长连接==，主库后续写操作同样会记录到replication buffer中，后续会将replication buffer中的数据发送给从节点完成传输，但一定需要注意的是每一个从节点都会在主节点有一个replication buffer，因为每个主节点的复制速度不一样，会有速度差异。

看完主从同步的流程图后，不知道有没有发现一个问题，在主从节点建立连接后需要主节点马上生成RDB文件，有多个从节点就要生成多次，如果Redis的集群过大对于主节点而言这个全量复制不就会是灾难性的吗？这就要聊到Redis推出的另外一个集群结构：主-从-从结构。

主从从结构

Redis了减缓主节点的全量复制压力以及RDB文件传输的压力，推出主-从-从结构，其结构有点类似企业中的组织结构，如下所示

上述结构的好处是主节点A不再需要同步给从节点D,E由从节点C分担了主节点A的压力，从而保证主节点A的性能。

主从架构将读写压力分散，而且主从的数据同步可以通过全量复制和长链接保证，但如果从节点网络阻塞或者网络断联后，应该如何保证数据的一致性呢？

避免网络问题造成一致性问题

在Redis2.8之前，Redis主从节点在命令传播过程中网络出现问题，那么主从之间的数据需要重新进行全量复制，显然这对Redis的开销压力大。

在Redis2.8开始，网络断了后主从节点只是进行增量同步，那如何知道增量复制的范围呢？这就需要借助repl_backlog_buffer

只要在主节点有数据写入，那么就会写入repl_backlog_buffer中这是一个环形结构，当从库断连后又重新连接后，从库通过psync会将从库偏移量slave_repl_offset告诉主库，主库通过自己的偏移量master_repl_offset对比从库偏移量slave_repl_offset，得到增量数据同步给从库（同步还是需要借用长连接也就是所谓的replication buffer），如下图所示增量数据就是put b c两个。

slave_repl_offset 这个数据是由从节点记录，所以有多少个从节点就会有多少个slave_repl_offset值，因为每个从节点的复制进度不会相同，而repl_backlog_buffer是共享的，所有从节点共享这个环形数组。

所以主从同步步骤细化如下

注意点

既然repl_backlog_buffer是环形结构，如果主节点的写入速度过快，覆盖了从节点读取的偏移量slave_repl_offset，那么这时会走全量复制，并不会走增量复制，所以repl_backlog_buffer环形结构的大小设置至关重要，如果设置小了触发全量复制的几率就高，设置大了对内存又是浪费，这个大小由repl_backlog_size值控制，参考公式如下

（主节点写入速度-主从库网络传输速度）* 操作大小 * 2

假设主节点的写入速度每秒2000个操作，每个操作大小为2K，主从库网络传输速度为1000个，那么在单位时间内还有1000个需要缓存起来，所以需要2M的数据，为应对突发情况所以这个值为4M，这个公式只是参考可以根据Redis所在服务器的性能情况再来调整。

Redis主从复制

Redis主从复制

Redis的集群结构

主从同步细节

主从连接建立

注意点

主从从结构

避免网络问题造成一致性问题

注意点

相关推荐

idea本地配置连接远程hadoop集群的一些网络问题解决汇总

无缓存不行?例行升级的入门级阿斯加特AN2 SSD装机点评

Ceph运维手册(基于P版本)

大数据开发前要做什么准备?8台Hadoop服务器进行集群规划前配置

Tensorflow分类loss函数总结 tensorflow绘制loss曲线

R语言学习笔记(七) -离散型数据的模型预测2

iOS Runtime详解

7 个对 Java 意义重大的性能指标，你知道几个?

PHP 远程调试最佳实践

Laravel框架使用图片处理简单教程