yarn-cluster

 spark(四)yarn上的运行模式

 

yarn-client

 spark(四)yarn上的运行模式

 

区别

Yarn-cluster

spark的driver运行在applicationMaster内,启动流程为:

 spark(四)yarn上的运行模式

 

这张图可能比较直观

 spark(四)yarn上的运行模式

 

Yarn-client

Spark client向yarn的RM申请资源容器,得到AM,但是这个AM运行在其他nodemanager,并得到其他executor的运行容器。而spark的driver运行在client中。

 

总结

Yarn-client有单点故障的问题,当client意外死亡后,spark的driver也就一起死亡,并没有其他手段可以恢复。而yarn-cluster中的spark driver运行在有AM的nodemanager,死亡后可以继续在其他nodemanager恢复。

Yarn-client的唯一优点就是方便看调试信息,因为它就跑在client上,不会出现在集群的其他位置。

相关文章:

  • 2021-09-04
  • 2021-08-20
  • 2021-11-12
  • 2021-09-21
  • 2021-04-03
  • 2022-12-23
  • 2021-12-25
  • 2022-12-23
猜你喜欢
  • 2021-05-18
  • 2021-07-06
  • 2021-11-13
  • 2021-04-14
  • 2021-08-19
  • 2022-03-09
  • 2021-12-25
相关资源
相似解决方案