【发布时间】:2023-04-05 10:31:01
【问题描述】:
我有一个异构集群。例如,我有以下机器:
- 1核1g
- 2核2g
- 3核3g
- 5核5g
- 5核5g
我的 Spark 集群处于独立模式。
问题是当我使用带有默认参数的spark-submit 时,它将使用我的整个集群资源。但是当我在应用程序中进入仪表板时,我可以看到一个执行器有 5 个核心但只使用了 1g 内存。
如果我配置executor-memory 5g,那些内存小于5g的节点不会启动executor。
如何配置 Spark 以在一个应用程序中支持不同规格的执行器?
例如:
- executor1:1核1g
- executor2:2core 2g
- ..等
【问题讨论】:
-
我从未见过有人这样做。集群中的所有 Worker 都是相同的。 AWS 可能与 EMR 不同。
-
用于 YARN,而不是独立的
-
那么Spark Executor中的内存一定要固定?
-
实际上,对于 YARN,它是不同的,但是对于我自己拥有的 Stand Alone,您可以为每个 Worker 做。 docs.cloudera.com/documentation/enterprise/5-2-x/topics/…
-
查看新答案,抱歉,我最初忘记了 Stand Alone 方面。
标签: apache-spark