• Zookeeper选举需要关注的几个权重值

服务器id:

    比如集群有5台服务器,id分别为1-5,id越大选举过程中的权重越大

选举状态:

    LOOKING,竞选状态。

    FOLLOWING,随从状态。同步leader状态,参与投票。

    OBSERVING,观察状态,同步leader状态,不参与任何投票。

    LEADING,领导者状态。

数据ID:

    服务器中存放的最新数据的version,值越大说明数据版本越新,在选举算法中的权重越大。

逻辑时钟:

    也可以叫投票的次数,同一轮投票过程中的逻辑时钟是相同的,每投完一次票这个数值都会增加,然后与接收到的其他服务器返回的投票信息中的数值相比,根据值不同做出不同的判断。

  • 半数启动:

    集群启动必须有半数以上机器active,否则集群不启动。故集群中半数以上机器存活,集群可用。所以Zookeeper适合安装奇数台服务器。

  • Master在哪个阶段产生

    Zookeeper在配置文件中并没有指定Master和Slave。但是,Zookeeper工作时,是有一个节点为Leader,其他则为Follower,Leader是通过内部的选举机制临时产生的。

    Zookeeper的节点状态有三种1,leader;2,follower;3,looking

  • Leader选举产生过程

     Zookeeper选举机制

 Zookeeper的选举机制

集群启动时情况一:集群为空集群,集群机器首次启动且按1-5的顺序启动

(1)服务器1启动,发起一次选举。服务器1投自己一票。此时服务器1票数一票,不够半数以上(3票),选举无法完成,服务器1状态保持为LOOKING;集群不对外提供服务。

(2)服务器2启动,再发起一次选举。服务器1和2分别投自己一票并交换选票信息:此时服务器1发现服务器2的ID比自己目前投票推举的(服务器1)大,更改选票为推举服务器2。此时服务器1票数0票,服务器2票数2票,没有半数以上结果,选举无法完成,服务器1,2状态保持LOOKING。集群不对外提供服务。

(3)服务器3启动,发起一次选举。此时服务器1和2都会更改选票为服务器3。此次投票结果:服务器1为0票,服务器2为0票,服务器3为3票。此时服务器3的票数已经超过半数,服务器3当选Leader。服务器1,2更改状态为FOLLOWING,服务器3更改状态为LEADING;集群开始对外提供服务。

(4)服务器4启动,发起一次选举。此时服务器1,2,3已经不是LOOKING状态,不会更改选票信息。交换选票信息结果:服务器3为3票,服务器4为1票。此时服务器4服从多数,更改选票信息为服务器3,并更改状态为FOLLOWING;

(5)服务器5启动,同4。

集群启动时情况二:集群不是空集群,即非首次启动

    对于运行正常的zookeeper集群,中途有机器down掉,需要重新选举时,选举过程就需要加入数据ID、服务器ID、和逻辑时钟。

这样选举就变成:

1.逻辑时钟小的选举结果被忽略,重新投票;(除去选举次数不完整的服务器)

2.统一逻辑时钟后,数据id大的胜出;(选出数据最新的服务器)

3.数据id相同的情况下,服务器id大的胜出。(数据相同的情况下, 选择服务器id最大,即权重最大的服务器)
 

相关文章: