【发布时间】:2017-08-27 09:43:11
【问题描述】:
在 YARN 上运行 Spark,集群模式。
- 3 个带有 YARN 的数据节点
- YARN => 32 个 vCore,32 GB RAM
我正在提交这样的 Spark 程序:
spark-submit \
--class com.blablacar.insights.etl.SparkETL \
--name ${JOB_NAME} \
--master yarn \
--num-executors 1 \
--deploy-mode cluster \
--driver-memory 512m \
--driver-cores 1 \
--executor-memory 2g \
--executor-cores 20 \
toto.jar json
我可以看到 2 个作业在 2 个节点上运行良好。但我还可以看到其他 2 个仅使用驱动程序容器的工作!
如果没有工人资源,是否可以不运行驱动程序?
【问题讨论】:
标签: hadoop apache-spark hadoop-yarn