【发布时间】:2018-05-15 06:54:33
【问题描述】:
我有一个形式的 RDD: 数组((A,3), (B,5), (C,88))
我想在scala中转换成json格式
{ “一”:3, “乙”:5, “C”:88, }
【问题讨论】:
-
您使用的是什么版本的 spark?你能把这个RDD转换成DF吗?那会让你的生活更轻松。但要求只有 RDD,那么您可能想尝试 json4s 或类似的
-
Spark 1.6 .. 是的,我尝试使用 toDF() 但它不起作用
-
如果我们将其转换为 DF ,我们将得到类似 {"_1":"A","_2":3} {"_1":"B","_2" :5} {"_1":"C","_2":88} 这就是你要找的吗?
-
val x: Array[(String, Int)] = Array(("A",3), ("B",5), ("C",88)) val distData: RDD [(String, Int)] = sparkSession.sparkContext.parallelize(x) val df: DataFrame = sparkSession.sqlContext.createDataFrame(distData) df.write.json("resources/myJson.json") }