【发布时间】:2015-12-03 16:13:09
【问题描述】:
我编写了以下代码,它返回“找不到类”异常。我不确定如何将数据从 csv 文件加载到 SparkSQL。
import org.apache.spark.SparkContext
/**
* Loading sales csv using DataFrame API
*/
object CsvDataInput {
def main(args: Array[String]) {
val sc = new SparkContext(args(0), "Csv loading example")
val sqlContext = new org.apache.spark.sql.SQLContext(sc)
val df = sqlContext.load("com.databricks.spark.csv", Map("path" -> args(1),"header"->"true"))
df.printSchema()
df.registerTempTable("data")
val aggDF = sqlContext.sql("select * from data")
println(aggDF.collectAsList())
}
}
【问题讨论】:
-
您好,您能否提供更多信息:您是如何执行此代码的,以及您遇到的完整错误?
标签: hadoop apache-spark cloudera apache-spark-sql apache-spark-1.4