【发布时间】:2021-12-07 07:33:18
【问题描述】:
我有一个要求,在文件的一行中生成多个 JSON 有效负载记录(末尾没有换行符,确切的 JSON 记录太长,无法在此处添加)。
示例:sample.json(来自源代码) [{complex-json-record1},{complex-json-record2},{complex-json-record3},{complex-json-record4}...]
有没有办法在每个 JSON 记录之后在 Python/PySpark/Pandas 中添加换行符(换行符)?
这样至少我可以每行获得一条记录。
仍在努力将该 JSON 转换为 Hive 表。
谢谢!
【问题讨论】:
-
查看 JSON 规范,您可以有效地在标记之间插入任何空格。有一种称为漂亮打印的算法,也许这就是你所追求的。浏览器有一些工具可以以人类可读的方式显示 JSON,例如JSON发现。在命令行上有
jq。