elastic job原理解析

elastic job原理解析

1、每个作业进程都对应一个JobInstance，存储在JobRegistry中

一个instance就是运行此job分片的一个进程，instanceid由ip+进程号组成。

JobName -> JobInstance

JobName -> shardtotalNumber（该job分片的总数）

JobName -> 作业是否运行

JobName -> JobScheduleController（作业调度控制器）

JobName -> CoordinaryRegistryCenter(注册中心)

2、主节点选举触发

a、主节点down机

b、主节点机器设置为disable

3、重新分片触发

a、config的分片总数发生了变化

b、节点down

4、failover的触发

a、节点down，运行在这个instanceid上的分片或者已经failover的分片会重新标记成failover

b、关于failover的配置改变设置为false，删除failover的相关信息

监听到failover的节点如果当前没有要运行的作业，则直接抓取failover的分片执行。

5、在instanceid上添加TRIGGER，可以出发当前的instance上的job运行（前提是此instance上的job不在运行中）。

6、配置改变会从新调度作业。

7、与zookeeper之间的连接丢失会停止作业调度，等待连接恢复会重新调度。

JobScheduleController就是封装了quartz的调度信息。

以上文章都是根据elasticjob2.1.5的源码所写，具体细节还得看源代码。有不足之处还望指正。