【发布时间】:2017-09-20 21:01:56
【问题描述】:
我对此完全陌生,所以我不太了解它是如何做的。 我需要在我的机器上运行 spark(使用 ssh 登录)并设置内存 60g 和 6 个内核用于执行。 这是我尝试过的。
spark-submit --master yarn --deploy-mode cluster --executor-memory 60g --executor-cores 6
这就是我得到的:
SPARK_MAJOR_VERSION is set to 2, using Spark2
Exception in thread "main" java.lang.IllegalArgumentException: Missing application resource.
at org.apache.spark.launcher.CommandBuilderUtils.checkArgument(CommandBuilderUtils.java:253)
at org.apache.spark.launcher.SparkSubmitCommandBuilder.buildSparkSubmitArgs(SparkSubmitCommandBuilder.java:160)
at org.apache.spark.launcher.SparkSubmitCommandBuilder.buildSparkSubmitCommand(SparkSubmitCommandBuilder.java:276)
at org.apache.spark.launcher.SparkSubmitCommandBuilder.buildCommand(SparkSubmitCommandBuilder.java:151)
at org.apache.spark.launcher.Main.main(Main.java:87)
所以,我想有一些东西要添加到此代码行以运行,我不知道是什么。
【问题讨论】:
-
您缺少
--class package.ClassName和您要提交的JAR。
标签: apache-spark command-line pyspark distributed-computing