【发布时间】:2014-03-09 14:43:07
【问题描述】:
我有一个数 GB 的 JSON 文件。该文件由每个不超过几千个字符的 JSON 对象组成,但记录之间没有换行符。
使用 Python 3 和 json 模块,如何一次将一个 JSON 对象从文件读取到内存中?
数据在纯文本文件中。这是一个类似记录的例子。实际记录包含许多嵌套的字典和列表。
以可读格式记录:
{
"results": {
"__metadata": {
"type": "DataServiceProviderDemo.Address"
},
"Street": "NE 228th",
"City": "Sammamish",
"State": "WA",
"ZipCode": "98074",
"Country": "USA"
}
}
}
实际格式。新记录一个接一个地开始,没有任何中断。
{"results": { "__metadata": {"type": "DataServiceProviderDemo.Address"},"Street": "NE 228th","City": "Sammamish","State": "WA","ZipCode": "98074","Country": "USA" } } }{"results": { "__metadata": {"type": "DataServiceProviderDemo.Address"},"Street": "NE 228th","City": "Sammamish","State": "WA","ZipCode": "98074","Country": "USA" } } }{"results": { "__metadata": {"type": "DataServiceProviderDemo.Address"},"Street": "NE 228th","City": "Sammamish","State": "WA","ZipCode": "98074","Country": "USA" } } }
【问题讨论】:
-
发布数据样本,至少有几个对象。
-
你的意思是 JSON 文件是一个对象数组,你想懒惰地读取这些对象?
-
您是否已经在 Stack Overflow 上搜索过有关此主题的其他帖子?我可以在此处的“相关”侧边栏中至少列出一个。这些帖子如何没有解决您的具体情况?
-
@poke 我不确定你所说的“懒惰”是什么意思,但是是的,我认为这就是我想要的。
-
@MartijnPieters 我能找到的其他帖子都没有解决同样的问题。你能分享你找到的解决方案的链接吗?