【发布时间】:2017-02-19 04:23:52
【问题描述】:
我正在尝试采用硬编码字符串并将其转换为 1 行 Spark DataFrame(具有 StringType 类型的单列),这样:
String fizz = "buzz"
会产生一个 DataFrame,其 .show() 方法如下所示:
+-----+
| fizz|
+-----+
| buzz|
+-----+
到目前为止,我最好的尝试是:
val rawData = List("fizz")
val df = sqlContext.sparkContext.parallelize(Seq(rawData)).toDF()
df.show()
但我得到以下编译器错误:
java.lang.ClassCastException: org.apache.spark.sql.types.ArrayType cannot be cast to org.apache.spark.sql.types.StructType
at org.apache.spark.sql.SQLContext.createDataFrame(SQLContext.scala:413)
at org.apache.spark.sql.SQLImplicits.rddToDataFrameHolder(SQLImplicits.scala:155)
关于我要去哪里出错的任何想法?另外,如何将"buzz" 设置为fizz 列的行值?
更新:
尝试:
sqlContext.sparkContext.parallelize(rawData).toDF()
我得到一个看起来像这样的 DF:
+----+
| _1|
+----+
|buzz|
+----+
【问题讨论】:
标签: scala apache-spark spark-dataframe