Spark Scala如何执行答案

【问题标题】：Spark Scala how to executeSpark Scala如何执行
【发布时间】：2015-12-03 16:13:09
【问题描述】：

我编写了以下代码，它返回“找不到类”异常。我不确定如何将数据从 csv 文件加载到 SparkSQL。

import org.apache.spark.SparkContext

/**

 * Loading sales csv using DataFrame API

 */

object CsvDataInput {

  def main(args: Array[String]) {    

    val sc = new SparkContext(args(0), "Csv loading example")

    val sqlContext = new org.apache.spark.sql.SQLContext(sc)

    val df = sqlContext.load("com.databricks.spark.csv", Map("path" -> args(1),"header"->"true"))

    df.printSchema()

    df.registerTempTable("data")

    val aggDF = sqlContext.sql("select * from data")

    println(aggDF.collectAsList())

  } 
}

【问题讨论】：

您好，您能否提供更多信息：您是如何执行此代码的，以及您遇到的完整错误？

标签： hadoop apache-spark cloudera apache-spark-sql apache-spark-1.4

【解决方案1】：

尝试替换此行

import org.apache.spark.SparkContext

有了这个

import org.apache.spark.*

您只导入了库的一部分，但使用了该部分之外的类。此外，您的导入实际上拼写错误 - 它应该是 org.apache.spark.sql.SQLContext，并且您使用了其他一些包，与提供的代码无关。

【讨论】：