【问题标题】:Apache Spark running on YARN with fix allocationApache Spark 在 YARN 上运行并修复分配
【发布时间】:2018-09-26 20:02:01
【问题描述】:

现在发生的事情是 YARN 只是从一个 spark 作业中获取多个 executor,然后将其交给另一个 spark 作业。结果,这个 spark 作业遇到错误并死掉。

是否有一种方法或现有配置可以使在 YARN 上运行的某个 Spark 作业具有固定的资源分配?

【问题讨论】:

  • 您好,您的问题不清楚。你可以用一些代码sn-ps等更新它以使上下文更清晰。请参考stackoverflow.com/help/mcve

标签: apache-spark resources hadoop-yarn


【解决方案1】:

修复资源分配是一个古老的概念,并没有为适当的资源利用带来好处。动态资源分配是 YARN 的高级/预期功能。所以,我建议你看看实际发生了什么。如果作业已经在运行,那么 YARN 不会占用资源并将其提供给其他人。如果资源不可用,则第二个作业将排队,并且不会从第一个作业中突然提取资源。原因是容器具有内存和 CPU 的组合。如果将内存分配给其他作业,则基本上意味着第一个作业的 JVM 将永远丢失。 YARN 没有做上面提到的事情。

【讨论】:

    猜你喜欢
    • 2017-09-01
    • 2017-04-16
    • 1970-01-01
    • 2018-05-12
    • 1970-01-01
    • 2016-11-05
    • 2016-07-23
    • 1970-01-01
    • 2019-01-22
    相关资源
    最近更新 更多