【问题标题】:How to run a Spark jar file from AWS Console without Spark-Shell如何在没有 Spark-Shell 的情况下从 AWS 控制台运行 Spark jar 文件
【发布时间】:2015-04-14 20:17:24
【问题描述】:

我正在尝试在 AWS EMR 控制台(亚马逊网络服务)上运行 Spark 应用程序。我在 jar 中编译的 Scala 脚本将 SparkConf 设置作为参数或字符串:

val sparkConf = new SparkConf()
  .setAppName("WikipediaGraphXPageRank")
  .setMaster(args(1))
  .set("spark.executor.memory","1g")
  .registerKryoClasses(Array(classOf[PRVertex], classOf[PRMessage]))

但是,我不知道如何在上传并设置集群时将 Master-URL 参数和其他参数传递给 jar。需要明确的是,我知道如果我正在运行 Spark-Shell,我会以另一种方式执行此操作,但我是 Windows 用户,并且按照我目前的设置和工作,这将非常有用在“步骤”中通过某种方式将主 URL 传递给 EMR 集群。

我不想使用 Spark-Shell,我的截止日期很近,并且所有东西都以这种方式进行设置,并且感觉就像将主 URL 作为参数传递的这个小问题应该是可能的,考虑到 AWS拥有在 EMR 上运行独立 Spark 应用程序的指南。

我们将不胜感激!

【问题讨论】:

  • 你可以使用 spark-submit 吗?
  • 您的 aws 实例的类型是什么?
  • @Metropolis - 已经尝试过 Spark-submit!
  • @Elisiah - 这是我通过 SHH 控制的 EMR 实例。
  • @user3297367 你有解决办法吗?

标签: amazon-web-services jar apache-spark emr


【解决方案1】:

【讨论】:

    猜你喜欢
    • 2015-11-06
    • 1970-01-01
    • 2022-01-04
    • 2014-07-04
    • 2019-03-16
    • 2020-09-20
    • 2023-03-24
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多