一、elastic job 2.1.5 较之前的版本改动了在zookeeper上的信息,zk上的存储和相关说明如下图:

elastic job原理解析

二、elasticjob的基本概念

1、每个作业进程都对应一个JobInstance,存储在JobRegistry中
      一个instance就是运行此job分片的一个进程,instanceid由ip+进程号组成。
      JobName -> JobInstance
      JobName -> shardtotalNumber(该job分片的总数)
      JobName -> 作业是否运行
      JobName -> JobScheduleController(作业调度控制器)
      JobName -> CoordinaryRegistryCenter(注册中心)

2、主节点选举触发
      a、主节点down机
      b、主节点机器设置为disable

3、重新分片触发
      a、config的分片总数发生了变化
      b、节点down

4、failover的触发
     a、节点down,运行在这个instanceid上的分片或者已经failover的分片会重新标记成failover
     b、关于failover的配置改变设置为false,删除failover的相关信息
     监听到failover的节点如果当前没有要运行的作业,则直接抓取failover的分片执行。

5、在instanceid上添加TRIGGER,可以出发当前的instance上的job运行(前提是此instance上的job不在运行中)。

6、配置改变会从新调度作业。

7、与zookeeper之间的连接丢失会停止作业调度,等待连接恢复会重新调度。 

三、启动流程如下图:

JobScheduleController就是封装了quartz的调度信息。
elastic job原理解析

四、作业分片流程如下图:

elastic job原理解析

五、获取要执行的分片流程如下图:

elastic job原理解析



六、作业执行流程如下图:

elastic job原理解析

七、总结

        以上文章都是根据elasticjob2.1.5的源码所写,具体细节还得看源代码。有不足之处还望指正。

相关文章: