【发布时间】:2015-06-07 11:15:08
【问题描述】:
按照说明通过 ec2 脚本安装集群后,我无法正确启动我的 .jar,因为他们没有找到我放在主节点和从节点上 /root/persistent-hdfs/ 的数据文件. 我在另一篇文章中读到我需要在文件位置前加上 file:// 但它不会改变任何东西......我有这个错误:
线程“主”org.apache.hadoop.mapred.InvalidInputException 中的异常:输入路径不存在:file://root/persistent-hdfs/data/ds_1.csv
为了启动作业,我在主节点上使用了 ./bin/spark-submit,对吗?
提前感谢您的支持。
【问题讨论】:
-
请发布您要提交作业的完整命令。同时发布您的工作代码。
-
我使用了这个命令:spark_submit --class "MS1" MS1.jar
标签: scala amazon-ec2 apache-spark