【发布时间】:2018-04-22 17:05:47
【问题描述】:
我正在开发一个 spark 项目,我正在使用具有以下配置的 3 个节点的 hadoop 集群:
- 8cores 和 16go of Ram(Namenode、Application Master、nodemanager 和 spark master 和 worker)。
- 4cores and 8go of Ram(datanode、nodemanager和worker)
-
4cores and 4go of Ram(datanode、nodemanager和worker) 所以我使用以下配置:
pyspark --master yarn-client --driver-memory 3g --executor-memory 1g --num-executors 3 --executor-cores 1
在我的所有集群性能中,您使用的最佳执行器、内存和内核数量是多少?
【问题讨论】:
标签: apache-spark hadoop pyspark