【发布时间】:2014-11-27 21:08:23
【问题描述】:
如何从 Java(或 Scala)代码中配置具有 SparkConfig 和 SparkContext 的执行程序数量?我经常看到 2 个执行者。看起来spark.default.parallelism 不起作用并且是关于不同的东西。
我只需要将执行器的数量设置为等于集群大小,但始终只有 2 个。我知道我的集群大小。如果这很重要,我会在 YARN 上运行。
【问题讨论】:
标签: java scala cluster-computing apache-spark hadoop-yarn