【发布时间】:2015-04-14 20:17:24
【问题描述】:
我正在尝试在 AWS EMR 控制台(亚马逊网络服务)上运行 Spark 应用程序。我在 jar 中编译的 Scala 脚本将 SparkConf 设置作为参数或字符串:
val sparkConf = new SparkConf()
.setAppName("WikipediaGraphXPageRank")
.setMaster(args(1))
.set("spark.executor.memory","1g")
.registerKryoClasses(Array(classOf[PRVertex], classOf[PRMessage]))
但是,我不知道如何在上传并设置集群时将 Master-URL 参数和其他参数传递给 jar。需要明确的是,我知道如果我正在运行 Spark-Shell,我会以另一种方式执行此操作,但我是 Windows 用户,并且按照我目前的设置和工作,这将非常有用在“步骤”中通过某种方式将主 URL 传递给 EMR 集群。
我不想使用 Spark-Shell,我的截止日期很近,并且所有东西都以这种方式进行设置,并且感觉就像将主 URL 作为参数传递的这个小问题应该是可能的,考虑到 AWS拥有在 EMR 上运行独立 Spark 应用程序的指南。
我们将不胜感激!
【问题讨论】:
-
你可以使用 spark-submit 吗?
-
您的 aws 实例的类型是什么?
-
@Metropolis - 已经尝试过 Spark-submit!
-
@Elisiah - 这是我通过 SHH 控制的 EMR 实例。
-
@user3297367 你有解决办法吗?
标签: amazon-web-services jar apache-spark emr