【问题标题】:idea sbt java.lang.NoClassDefFoundError: org/apache/spark/SparkConf想法 sbt java.lang.NoClassDefFoundError: org/apache/spark/SparkConf
【发布时间】:2016-10-17 09:26:29
【问题描述】:

我是spark的初学者。我用“linux + idea + sbt”搭建环境,当我尝试快速启动Spark时,我遇到了问题:

    Exception in thread "main" java.lang.NoClassDefFoundError: org/apache/spark/SparkConf
    at test$.main(test.scala:11)
    at test.main(test.scala)
    at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
    at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
    at java.lang.reflect.Method.invoke(Method.java:498)
    at com.intellij.rt.execution.application.AppMain.main(AppMain.java:144)
Caused by: java.lang.ClassNotFoundException: org.apache.spark.SparkConf
    at java.net.URLClassLoader.findClass(URLClassLoader.java:381)
    at java.lang.ClassLoader.loadClass(ClassLoader.java:424)
    at sun.misc.Launcher$AppClassLoader.loadClass(Launcher.java:331)
    at java.lang.ClassLoader.loadClass(ClassLoader.java:357)
    ... 7 more

我磁盘中的版本:

sbt   = 0.13.11
jdk   = 1.8
scala = 2.10
idea  = 2016

我的目录结构:

test/
  idea/
  out/
  project/
    build.properties    
    plugins.sbt
  src/
    main/
      java/
      resources/
      scala/
      scala-2.10/
        test.scala
  target/
  assembly.sbt
  build.sbt

在 build.properties 中:

sbt.version = 0.13.8

在 plugins.sbt 中:

logLevel := Level.Warn

addSbtPlugin("com.github.mpeltonen" % "sbt-idea" % "1.6.0")

addSbtPlugin("com.eed3si9n" % "sbt-assembly" % "0.11.2")

在 build.sbt 中:

import sbt._
import Keys._
import sbtassembly.Plugin._
import AssemblyKeys._

name := "test"

version := "1.0"

scalaVersion := "2.10.4"

libraryDependencies += "org.apache.spark" % "spark-core_2.10" % "1.6.1" % "provided"

在 assembly.sbt 中:

import AssemblyKeys._ // put this at the top of the file

assemblySettings

在 test.scala 中:

import org.apache.spark.SparkContext
import org.apache.spark.SparkContext._
import org.apache.spark.SparkConf

object test {
  def main(args: Array[String]) {
    val logFile = "/opt/spark-1.6.1-bin-hadoop2.6/README.md" // Should be some file on your system
    val conf = new SparkConf().setAppName("Test Application")
    val sc = new SparkContext(conf)
    val logData = sc.textFile(logFile, 2).cache()
    val numAs = logData.filter(line => line.contains("a")).count()
    val numBs = logData.filter(line => line.contains("b")).count()
    println("Lines with a: %s, Lines with b: %s".format(numAs, numBs))
  }
}

我该如何解决这个问题。

【问题讨论】:

    标签: scala apache-spark sbt


    【解决方案1】:

    "provided" 范围的依赖项仅在编译和测试期间可用,在运行时或打包时不可用。因此,不要使用main 来创建对象test,而是应该将其设置为放置在src/test/scala 中的实际测试套件(如果您不熟悉Scala 中的单元测试,我建议使用ScalaTest ,例如。首先在你的 build.sbt 中添加一个对它的依赖:libraryDependencies += "org.scalatest" %% "scalatest" % "2.2.4" % Test 然后去这个quick start tutorial 来实现一个简单的规范。


    在我看来,另一种选择非常 hacky(但仍然有效),涉及在某些配置中从您的 spark-core 依赖项中删除 provided 范围,并在接受的this question 答案中进行了描述。

    【讨论】:

    • 我对 Scala 类 src/main/scala/app/Main.scala 有这个问题。一切看起来都很好,应用程序被执行,但我无法实例化ScparkConf(),因为我也得到了NoClassDefFoundError。我正在关注this tutorial,它也在依赖管理中使用provided。我不太明白的是,在我看来,这似乎应该像这样工作。那么我应该删除provided 还是即使设置了这个标志也可以完成这项工作?
    【解决方案2】:

    在 intelliJ 版本 2018.1 中,运行配置中有一个复选框,名为“包含具有“已提供”范围的依赖项”。选中此选项为我解决了问题。

    【讨论】:

    • 该选项在 v2020.1 中仍然存在
    • 此答案有效,但您需要找到此选项,因为根据您的 IntelliJ 版本,它位于不同的位置。您可以像 intellij 一样搜索它,包括具有提供范围的依赖项。
    【解决方案3】:

    今天早上我遇到了同样的问题,提供的错误。我删除了“提供”并运行 sbt clean, reload, compile, package, run 。我还从命令行使用 spark-submit 进行测试。但我认为“提供”,代码的额外开销,jar 更少。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2022-01-07
      • 1970-01-01
      • 2017-03-10
      • 2020-08-31
      • 2019-06-01
      • 2018-03-10
      相关资源
      最近更新 更多