【发布时间】:2016-06-30 21:06:28
【问题描述】:
有没有人通过 Oozie 在 HDP 中成功运行 Spark 操作?
我正在使用 Oozie 4.2.0 在 HDP 2.3.2 上运行。火花动作设置为在纱线集群模式下运行。 spark 作业是一个虚拟作业,没有输入文件。
我首先遇到了here 的错误,并通过从 hdfs oozie spark lib 文件夹中删除以下内容(在我的情况下为:/user/oozie/share/lib/lib_20151116201309/spark/)设法绕过它:
- tachyon-0.5.0.jar
- tachyon-client-0.5.0.jar(都是因为this错误)
- spark-core_2.10-1.1.0.jar
- spark-graphx_2.10-1.1.0.jar
- spark-streaming_2.10-1.1.0.jar
并在工作流库文件夹中添加以下内容:
- datanucleus-api-jdo-3.2.6.jar
- datanucleus-core-3.2.10.jar
- datanucleus-rdbms-3.2.9.jar
- spark-1.4.1.2.3.2.0-2950-yarn-shuffle.jar
- spark-assembly-1.4.1.2.3.2.0-2950-hadoop2.7.1.2.3.2.0-2950.jar
- spark-examples-1.4.1.2.3.2.0-2950-hadoop2.7.1.2.3.2.0-2950.jar
现在我遇到以下错误:
失败的 Oozie 启动器,主类 [org.apache.oozie.action.hadoop.SparkMain],main() 抛出异常,从 hdp4/10.10.1.84 调用到 0.0.0.0:8032 连接异常失败:java.net .ConnectException:连接被拒绝;更多详情请见:http://wiki.apache.org/hadoop/ConnectionRefused java.net.ConnectException:从 hdp4/10.10.1.84 到 0.0.0.0:8032 的调用因连接异常而失败:java.net.ConnectException:连接被拒绝;更多详情见:http://wiki.apache.org/hadoop/ConnectionRefused
我提到:
- 在 job.properties 文件和 yarn 配置文件中,作业跟踪器/资源管理器端口都设置为 8032
- 应用程序运行了大约 20 分钟(我运行了多次并观察到了这个时间)
【问题讨论】:
-
你能告诉我们你尝试了什么
-
您使用的是什么版本的 HDP?您尝试过什么,遇到了什么错误?
-
@PeterSmith 我已经添加了更多信息,谢谢
-
@TonTorres 我已经添加了更多信息,谢谢
标签: apache-spark oozie hortonworks-data-platform