【发布时间】:2019-09-11 01:25:55
【问题描述】:
我是 spark 新手,并试图将以下格式的 JSON 文件读入 spark 数据帧。这是我的 JSON 格式
“元素”:[
Q4
{
Name:ABC,
Language:English,
Age:45,
Title:SWE
},
Q5
{
Name:DEF,
Language:English,
Age:60
Title: Engineer
},
Q6
{
Name:HIJ,
Language:English,
Age:57,
Title:
}
] 我希望输出是
Name | Language | Age | Title
ABC | English | 45 | SWE
DEF | English | 60 | Engineer
HIJ | English | 57 | Null
如何使用 pyspark 实现这一目标?
【问题讨论】:
标签: json pyspark apache-spark-sql pyspark-sql