【问题标题】:mvn package elasticsearch-spark errormvn包elasticsearch-spark错误
【发布时间】:2016-02-21 18:13:56
【问题描述】:

我有一个maven项目想用es-spark来read from elasticsearch,我的pom.xml是这样的:

  <groupId>com.jzdata.logv</groupId>
  <artifactId>es-spark</artifactId>
  <version>0.0.1-SNAPSHOT</version>
  <packaging>jar</packaging>

  <name>es-spark</name>
  <url>http://maven.apache.org</url>

  <properties>
    <project.build.sourceEncoding>UTF-8</project.build.sourceEncoding>
  </properties>

  <dependencies>
    <dependency>
        <groupId>org.elasticsearch</groupId>
        <artifactId>elasticsearch-spark_2.11</artifactId>
        <version>2.1.2</version>
    </dependency>
  </dependencies>

   <build>
    <plugins>
     <plugin>  
       <groupId>org.apache.maven.plugins</groupId>  
       <artifactId>maven-compiler-plugin</artifactId>
       <version>3.1</version>  
       <configuration>  
         <source>1.7</source>  
         <target>1.7</target>  
       </configuration>  
     </plugin>
     <plugin>
        <groupId>org.apache.maven.plugins</groupId>
        <artifactId>maven-jar-plugin</artifactId>
        <version>2.6</version>
        <configuration>
          <archive>
            <manifest>
              <addClasspath>true</addClasspath>
              <classpathPrefix>lib/</classpathPrefix>
              <mainClass>my.main.class</mainClass>
            </manifest>
           </archive>
        </configuration>
      </plugin>
      <plugin>
        <groupId>org.apache.maven.plugins</groupId>
        <artifactId>maven-dependency-plugin</artifactId>
        <version>2.10</version>
        <executions>
          <execution>
            <id>copy-dependencies</id>
            <phase>package</phase>
            <goals>
              <goal>copy-dependencies</goal>
            </goals>
            <configuration>
              <outputDirectory>${project.build.directory}/lib</outputDirectory>
            </configuration>
          </execution>
        </executions>
      </plugin>
    </plugins>  
  </build>  

我的依赖是根据elasticsearch-spark install.

我想用依赖 jar 文件打包一个可运行的 JAR 文件。

我在哪里运行 cmd mvn package,它显示 没有找到org.apache.spark,org.apache.spark.api.java,但这些包在我的 maven 依赖项中。

我的错误步骤在哪里?

【问题讨论】:

    标签: maven elasticsearch apache-spark elasticsearch-hadoop


    【解决方案1】:

    该库旨在用于 Spark 应用程序,它假定 Spark 依赖项在加载时将可用。

    *同样,您希望 Spark 依赖项在您的应用程序运行时可用:RDD/DataFrames/SparkContext 都是 Spark 的一部分。 (*见下面我的评论)

    问题是您没有向编译器表明这一点,它认为您正在使用在执行期间不可用的库。这样想 - 构建失败是因为编译器认为您的应用程序无法工作。

    要解决此问题,您必须告诉编译器您希望在执行期间有可用的 Spark 库:

    <dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-core_2.11</artifactId> <version>1.6.0</version> <scope>provided</scope> </dependency>

    *重要提示* 您需要从您的工件中排除 Spark 库,否则您最终可能会得到多个版本的 Spark您的类路径(无论如何,它们没有理由包含它们,Spark 正在加载您的应用程序!)。将 scope 设置为 provided 会告诉编译器您期望 Spark 可用并且应该将其从输出中排除。

    https://maven.apache.org/guides/introduction/introduction-to-dependency-mechanism.html#Dependency_Scope

    【讨论】:

    • elasticsearch-spark_2.1 库具有相同的依赖项和范围(Spark 版本可能不同)。添加 elasticsearch-spark_2.1 作为依赖项的副作用是 Spark 成为(传递)依赖项。具有提供范围的传递依赖并不常见 - Sparks 框架是它有意义的少数情况之一。
    猜你喜欢
    • 2013-12-09
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2015-10-01
    • 2014-02-15
    • 2013-03-09
    • 2022-10-17
    相关资源
    最近更新 更多