【问题标题】:Spark Scala how to executeSpark Scala如何执行
【发布时间】:2015-12-03 16:13:09
【问题描述】:

我编写了以下代码,它返回“找不到类”异常。我不确定如何将数据从 csv 文件加载到 SparkSQL。

import org.apache.spark.SparkContext

/**

 * Loading sales csv using DataFrame API

 */

object CsvDataInput {

  def main(args: Array[String]) {    

    val sc = new SparkContext(args(0), "Csv loading example")

    val sqlContext = new org.apache.spark.sql.SQLContext(sc)

    val df = sqlContext.load("com.databricks.spark.csv", Map("path" -> args(1),"header"->"true"))

    df.printSchema()

    df.registerTempTable("data")

    val aggDF = sqlContext.sql("select * from data")

    println(aggDF.collectAsList())

  } 
}

【问题讨论】:

  • 您好,您能否提供更多信息:您是如何执行此代码的,以及您遇到的完整错误?

标签: hadoop apache-spark cloudera apache-spark-sql apache-spark-1.4


【解决方案1】:

尝试替换此行

import org.apache.spark.SparkContext

有了这个

import org.apache.spark.*

您只导入了库的一部分,但使用了该部分之外的类。此外,您的导入实际上拼写错误 - 它应该是 org.apache.spark.sql.SQLContext,并且您使用了其他一些包,与提供的代码无关。

【讨论】:

    猜你喜欢
    • 2020-04-02
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-05-22
    • 1970-01-01
    • 1970-01-01
    • 2021-11-09
    • 1970-01-01
    相关资源
    最近更新 更多