【发布时间】:2018-06-07 11:47:22
【问题描述】:
我正在使用未安装 Spark 的 intellij 项目加载 Spark。
val spark = SparkSession.builder().config(sparkConf).getOrCreate()
我已经使用 com.spark.databricks.xml 添加到 spark
sparkConf.set("spark.driver.extraClassPath", "C:/.../spark-xml_2.11-0.4.1.jar")
sparkConf.setExecutorEnv("spark.driver.extraClassPath", "C:/.../spark-xml_2.11-0.4.1.jar")
sparkConf.set("spark.executor.extraClassPath", "C:/.../spark-xml_2.11-0.4.1.jar")
sparkConf.setExecutorEnv("spark.executor.extraClassPath", "C:/.../spark-xml_2.11-0.4.1.jar")
sparkConf.setJars(Array("C:/.../spark-xml_2.11-0.4.1.jar" ))
与
spark.sparkContext.addJar("C:/.../spark-xml_2.10-0.2.0.jar")
但在尝试使用 spark.read.format ("com.databricks.spark.xml") 时出现异常“无法找到数据源:com.databricks.spark.xml。请在 http://spark.apache.org/third-party-projects.html 找到包”。
我该如何解决这个问题?我知道建议使用 spark-shell 添加 jars,但我没有 spark-shell,因为我没有安装 spark...
【问题讨论】:
标签: scala apache-spark databricks