【发布时间】:2021-03-12 00:18:12
【问题描述】:
我有以下 json:
{
"value":[
{"C1":"val1","C2":"val2"},
{"C1":"val1","C2":"val2"},
{"C1":"val1","C2":"val2"}
]
}
我想这样读:
spark.read
.option("multiLine", true).option("mode", "PERMISSIVE")
.json("/Projects.json")
.show(10)
但它无法在数据框中正确显示我的记录,我如何绕过该“值”嵌套以正确地将我的行包含在数据框中?
我想要得到的结果是:
C1 | C2
-------------------
VAL1 | VAL2
VAL1 | VAL2
...etc
【问题讨论】:
-
你希望它是什么样子的?
-
我想要一个显示列的数据框:C1、C2 我在我的问题中添加了一个示例 :)
-
@mike 有什么想法吗? ^^ 我被卡住了
-
我有时间仔细研究您的问题。猜猜使用 Spark 的 SQL 内置函数会更容易。
标签: scala apache-spark apache-spark-sql spark3