【发布时间】:2017-04-08 10:18:27
【问题描述】:
我有地图的 RDD,我想将其转换为数据框 这里是RDD的输入格式
val mapRDD: RDD[Map[String, String]] = sc.parallelize(Seq(
Map("empid" -> "12", "empName" -> "Rohan", "depId" -> "201"),
Map("empid" -> "13", "empName" -> "Ross", "depId" -> "201"),
Map("empid" -> "14", "empName" -> "Richard", "depId" -> "401"),
Map("empid" -> "15", "empName" -> "Michale", "depId" -> "501"),
Map("empid" -> "16", "empName" -> "John", "depId" -> "701")))
有什么办法可以像这样转换成数据框
val df=mapRDD.toDf
df.show
empid, empName, depId
12 Rohan 201
13 Ross 201
14 Richard 401
15 Michale 501
16 John 701
【问题讨论】:
-
“我有 RDD 的地图” - 更准确地说,你有“地图的 RDD”。
标签: scala apache-spark apache-spark-sql