【发布时间】:2015-07-09 20:11:11
【问题描述】:
有没有办法在不使用 spark-submit 脚本的情况下以 yarn-cluster 模式运行 pyspark 脚本?我需要这种方式,因为我会将这段代码集成到 django web 应用程序中。
当我尝试在 yarn-cluster 模式下运行任何脚本时,出现以下错误:
org.apache.spark.SparkException: Detected yarn-cluster mode, but isn't running on a cluster. Deployment to YARN is not supported directly by SparkContext. Please use spark-submit.
我正在通过以下方式创建 sparkContext:
conf = (SparkConf()
.setMaster("yarn-cluster")
.setAppName("DataFrameTest"))
sc = SparkContext(conf = conf)
#Dataframe code ....
谢谢
【问题讨论】:
标签: apache-spark hadoop-yarn pyspark