【发布时间】:2021-05-07 19:41:40
【问题描述】:
我正在使用 Spark 读取以下格式的 JSON 文档:
{
"items": [
{"type": "foo", value: 1},
{"type": "bar", value: 2}
]
}
也就是说,数组项由“类型”列标记。
鉴于我知道“类型”的词汇(即 {foo, bar}),我如何得到这样的数据框:
root
|-- bar: integer (nullable = true)
|-- foo: integer (nullable = true)
【问题讨论】:
标签: json apache-spark pyspark apache-spark-sql