【发布时间】:2017-01-23 11:30:13
【问题描述】:
我正在使用 EMR 5.0 和 Spark 2.0.0。 我正在尝试使用 org.apache.spark.launcher.SparkLauncher 从 Scala spark 应用程序运行子 spark 应用程序
我需要使用 setSparkHome 设置 SPARK_HOME:
var handle = new SparkLauncher()
.setAppResource("s3://my-bucket/python_code.py")
.setAppName("PythonAPP")
.setMaster("spark://" + sparkSession.conf.get("spark.driver.host") +":"+ sparkSession.conf.get("spark.driver.port"))
.setVerbose(true)
.setConf(SparkLauncher.EXECUTOR_CORES, "1")
.setSparkHome("/srv/spark") // not working
.setDeployMode("client")
.startApplication(
new SparkAppHandle.Listener() {
override def infoChanged(hndl: SparkAppHandle): Unit = {
System.out.println(hndl.getState() + " new state !")
}
override def stateChanged(hndl: SparkAppHandle): Unit = {
System.out.println(hndl.getState() + " new state !")
}
})
在哪里可以找到我的 Spark 主页的适当路径? 该集群由 1 个 Master、1 个 Core 和 1 个 Task 服务器构建而成。
谢谢!
【问题讨论】:
-
如果我理解正确的话,这将在 EMR 集群上运行,但不会使用 EMR 步骤,对吧?
标签: amazon-web-services apache-spark pyspark emr amazon-emr