【发布时间】:2020-02-26 11:53:18
【问题描述】:
我正在从 Jupiter 笔记本构建一个 spark(在 Apache Spark 版本 2.4.3 上运行)会话,如下所示
spark_session = SparkSession.builder
.master("yarn-client")
.enableHiveSupport()
.getOrCreate()
spark_session.conf.set("spark.executor.memory", '8g')
spark_session.conf.set('spark.executor.cores', '3')
spark_session.conf.set('spark.cores.max', '3')
spark_session.conf.set("spark.driver.memory",'8g')
sc = spark_session.sparkContext
我可以从应用程序主控中看到,所有参数都已正确设置,除了 spark.driver.memory。 spark.driver.memory 无论我如何设置它都只使用 1GB。
我已经检查了 spark-default.conf,但没有 spark.driver.memory 等参数。为了检查它是否与会话生成器/木星一起使用,我从命令行使用 spark-submit 运行了一个应用程序,令我惊讶的是它选择了我正在传递的驱动程序内存。
有人可以解释一下吗?为什么它不从 jupyter 中选择 spark.driver.memory 可能是什么原因
【问题讨论】:
标签: apache-spark jupyter-notebook hadoop-yarn