推荐学习:Redis教程
哨兵模式
1. 哨兵概念
在一主多从结构中,如果master宕机了,就需要从多个slave中选出一个作为新的master,要想完成这样的功能,就需要使用Redis的哨兵机制
哨兵 (sentinel) 是一个分布式系统,用于对主从结构中的每台服务器进行监控,当出现故障时通过投票机制选择新的master并将所有slave连接到新的master,如下图所示:
2. 哨兵作用
- 监控:监控master和slave
- 不断的检查master和slave是否正常运行
- master存活检测、master与slave运行情况检测
通知(提醒):当被监控的服务器出现问题时,向其他哨兵、Redis服务器发送通知
故障转移:断开宕机的master与slave的连接,选取一个slave作为master,将其他slave连接新的master,并告知客户端新的服务器地址
注意:哨兵也是一台redis服务器,仅提供监控服务,不提供数据管理服务;通常哨兵的数量配置为单数(方便投票)
3. 启用哨兵
修改哨兵的配置文件
sentinel.conf
,配置文件位于Redis目录下,如下图所示:部分配置的含义如下图所示:
启动哨兵
redis-sentinel filename #filename指的是配置文件名 #每个哨兵都要配置自己的配置文件
配置并启动哨兵之后,主服务器宕机之后,会自动的执行投票、主从切换等过程
4. 哨兵原理
哨兵在进行主从切换过程中经历三个阶段:
- 监控
- 通知
- 故障转移
4.1 监控
用于同步各个节点的状态信息,这些节点包括master、slave、哨兵,也就是整个系统所有服务器的信息。
主要完成的功能:
获取各个sentinel的状态(是否在线):新添加的哨兵要与系统中已经存在的哨兵进行信息的交互
获取master的状态(通过info指令)
获取的内容如下
1. master属性 runid role:master 2. 各个slave在master中保存的基本信息
获取所有slave的状态(根据master中slave的信息向所有的slave发送info指令)
获取的内容如下
slave属性 runid role:slave master_host、master_port offset
具体的内部工作原理如下所述:
- 哨兵1向master发送info指令之后,会建立一个cmd连接,创建的连接是用来发送命令的
- 创建好cmd连接之后,会在哨兵1这一端保存目前他所获得的所有信息,另一端master也会保存自己持有的信息
- 然后哨兵1根据从master获取的关于salve的信息,向slave发送info指令,得到salve的信息,丰富这一端所保存的信息
- 当新增一个新的哨兵2时,哨兵2向master发送info指令,建立cmd连接,根据master中的信息可以得到之前已经存在的哨兵1,在自己这一端保存已经获得的信息。然后判断哨兵1是否在线,与哨兵1建立连接,二者互相交换各自的信息,并且双方会持续的ping,保证他们之间是畅通的
- 哨兵2根据从master获得的slave信息,再从slave获取信息,丰富自己所保存的信息
- 再新增一个哨兵3时,与之前的过程类似,最终三个哨兵建立起了关系网
- 关系网中三者会互相交换、发送信息,关系网中的这种工作模式称为发布订阅模式
4.2 通知
哨兵在通知阶段要不断的去获取master与slave的信息,然后将获得的信息在各个哨兵之间进行共享。
具体的流程如下:
哨兵通过建立的cmd连接,向master、slave发送 hello
指令,得到他们的信息,然后在关系网中共享:
4.3 故障转移
断开宕机的master与slave的连接,选取一个slave作为master,将其他slave连接新的master,并告知客户端新的服务器地址。
具体的流程如下所述:
哨兵1始终得不到master的回应,主观判断master宕机,标记
sdown
(仅有一个哨兵认为master宕机)哨兵1在关系网中传递消息,向其他哨兵发送图中左上角的消息
其他哨兵得到消息之后,全部向master发送消息,确定master是否宕机,他们也会将自己得到的结果发送给关系网中的其他哨兵,确定master宕机后,将标记改为
odown
(所有哨兵探测之后,超过一半的哨兵认为master宕机)当认定master宕机之后,此时需要选举新的master,由哪个哨兵完成这件事要通过哨兵之间的选举决定,具体过程如下所述:
- 在选举的时候每个哨兵手里都有一票,每个哨兵都会发出一个指令,在内网里边告诉其他哨兵自己当选举人,比如说sentinel1和sentinel2发出这个选举指令,那么sentinel3接收到他们的申请之后,sentinel3就会把自己的一票投给其中一方,根据到达的先后顺序投票,获得票的那一方就会多一张选举票,按照这样的一种形式,最终会有一个选举结果,获得票数最多的哨兵会被获选
- 在这个过程中有可能会存在失败的现象,比如第一轮没有选举成功,那就会接着进行第二轮第三轮直到完成选举
当完成哨兵之间的选举之后,接下来就要由选举胜出的哨兵去slave中挑选一个,将其变成新的master,具体的流程如下所述:
- 哨兵在服务器列表中挑选备选master的原则:先排除,后选择
- 不在线的OUT
- 响应慢的OUT
- 与原master断开时间久的OUT
- 排除结束,开始进行选择
- 优先级高的获选
- offset较大的获选(比较大说明同步原来master的数据最多)
- 若还没有选出,则最后根据runid选出
- 哨兵在服务器列表中挑选备选master的原则:先排除,后选择
选出新的master之后,哨兵发送指令给服务器:
向新的master发送
slaveof no one
指令向其他slave发送
slaveof 新masterIP端口
指令
同时还要告诉其他的哨兵新master是谁
5. 总结
监控阶段:同步信息
通知阶段:保持联通
故障转移阶段:
- 哨兵发现问题,依次标记主观下线与客观下线
- 竞选负责哨兵
- 优选新master
- 新master上任,其他slave连接新的master,原master恢复之后作为slave连接到新master
推荐学习:Redis视频教程
以上就是一起来分析Redis哨兵模式的详细内容,更多请关注自由互联其它相关文章!