【发布时间】:2017-06-12 16:26:12
【问题描述】:
我正在尝试覆盖 spark 会话/spark 上下文默认配置,但它正在选择整个节点/集群资源。
spark = SparkSession.builder
.master("ip")
.enableHiveSupport()
.getOrCreate()
spark.conf.set("spark.executor.memory", '8g')
spark.conf.set('spark.executor.cores', '3')
spark.conf.set('spark.cores.max', '3')
spark.conf.set("spark.driver.memory",'8g')
sc = spark.sparkContext
当我将配置放入 spark submit 时它工作正常
spark-submit --master ip --executor-cores=3 --diver 10G code.py
【问题讨论】:
-
什么是资源管理器? Spark Standalone/YARN
-
2.0 的其他方式是
conf = (SparkConf().set("spark.executor.cores", "3")); spark = SparkSession.builder .master("ip").conf(conf=conf) .enableHiveSupport() .getOrCreate() -
抱歉,都试过了,都没有成功。能不能试一次。我刚刚将我的 spark 更新为 2.2.0 快照以解决 64KB 代码大小问题 (SPARK-16845)。
标签: python apache-spark pyspark spark-dataframe