【发布时间】:2018-07-16 16:45:03
【问题描述】:
在 PySpark 中创建 Spark 上下文时,我通常使用以下代码:
conf = (SparkConf().setMaster("yarn-client").setAppName(appname)
.set("spark.executor.memory", "10g")
.set("spark.executor.instances", "7")
.set("spark.driver.memory", "5g")
.set("spark.shuffle.service.enabled","true")
.set("spark.dynamicAllocation.enabled","true")
.set("spark.dynamicAllocation.minExecutors","5")
)
sc = SparkContext(conf=conf)
但是,这会将其置于默认队列中,该队列几乎总是超出容量。我们有几个不太忙的队列可用,所以我的问题是 - 如何设置我的 Spark 上下文以使用另一个队列?
编辑:澄清一下 - 我希望为交互式作业设置队列(例如,在 Jupyter 笔记本中进行探索性分析),因此我无法使用 spark-submit 设置队列。
【问题讨论】:
标签: hadoop apache-spark pyspark hadoop-yarn