【发布时间】:2019-02-20 13:47:44
【问题描述】:
Yarn 有两个著名的调度器,Fair Scheduler 和 Capacity Scheduler。粗略地说,Capacity 将集群划分为预定义的队列,从而保证每个队列的资源,Fair scheduler 也将集群划分为队列,并在队列之间和队列内部平均共享资源。
现在,进一步研究每个调度器的细节,我们发现:
- 它们中的每一个都允许集群的不均匀分区(公平的权重和资源分数以及容量百分比)
- 在队列应用调度中每一个都支持FIFO和FAIR
- 都支持基于内存和DRF的资源使用计算
我猜他们俩都“成长”到了这种情况,每个人都添加了功能。但是到今天为止,它们之间还有什么区别吗?
附:我是从使用 Yarn 管理 Spark
的上下文中提出的问题编辑:建议重复后,我将解释为什么,虽然相似,但它并没有完全回答问题,首先,答案不准确,例如,应用程序被分配给队列,而不是作业。最丰富的答案是一个比较表,它实际上取自quora answer,它是正确的,但可以追溯到2014-2016,它在获取开发进度的同时使其无关紧要。
【问题讨论】:
-
@user10465355 感谢您指出我们的答案,请参阅我的编辑并解释当前问题的有效性
标签: apache-spark hadoop-yarn scheduling