【发布时间】:2015-07-29 13:05:08
【问题描述】:
通过为 maven 依赖项提供 spark-classPath 来减小应用程序 jar 的大小:
我的集群有 3 个运行 hadoop 和 spark 的 ec2 实例。如果我使用 maven 依赖项构建 jar,它会变得太大(大约 100 MB),我想避免这种情况,因为 Jar 正在所有节点上进行复制,每次我运行作业时。
为了避免我将 maven 包构建为“maven 包”。为了解决依赖关系,我已经下载了每个节点上的所有 maven 依赖项,然后仅在上面的 jar 路径下方提供:
我在“spark-defaults.conf”中的每个节点上添加了类路径
spark.driver.extraClassPath /home/spark/.m2/repository/com/google/code/gson/gson/2.3.1/gson-2.3.1.jar:/home/spark/.m2/repository/com/datastax/cassandra/cassandra-driver-core/2.1.5/cassandra-driver-core-2.1.5.jar:/home/spark/.m2/repository/com/google/guava/guava/16.0.1/guava-16.0.1.jar:/home/spark/.m2/repository/com/google/collections/google-collections/1.0/google-collections-1.0.jar:/home/spark/.m2/repository/com/datastax/spark/spark-cassandra-connector-java_2.10/1.2.0-rc1/spark-cassandra-connector-java_2.10-1.2.0-rc1.jar:/home/spark/.m2/repository/com/datastax/spark/spark-cassandra-connector_2.10/1.2.0-rc1/spark-cassandra-connector_2.10-1.2.0-rc1.jar:/home/spark/.m2/repository/org/apache/cassandra/cassandra-thrift/2.1.3/cassandra-thrift-2.1.3.jar:/home/spark/.m2/repository/org/joda/joda-convert/1.2/joda-convert-1.2.jar
它在单个节点上本地工作。 我仍然收到此错误。任何帮助将不胜感激。
【问题讨论】:
标签: hadoop apache-spark classpath maven-3