【发布时间】:2019-02-25 14:38:57
【问题描述】:
我有一个很大的 JSONS 文件 (4,5 GB),我无法一次用 Python 打开它。该文件由几百万行全部采用 JSON 格式组成。每行是一个单独的 JSON 文件,用括号括起来,所以文件的格式是:
{JSON}
{JSON}
{JSON}
...
我希望能够逐行读取文件或一次读取前 200 行,但我不知道该怎么做。 是否可以逐行读取文件,然后将各个 JSON 的所需部分放入数据框中?还是数据框太大而无法处理?
提前致谢!
【问题讨论】:
-
请参阅my answer here 以阅读 jsonlines。您可以一次对 200 行执行类似操作。
-
“不能一次用 Python 打开”,是什么让你这么写,你有什么尝试?
-
我的电脑无法处理这么大的文件..
-
如果您希望人们帮助您,最好能提供尽可能详细的信息,说明您已经尝试过哪些命令/模块。简单地说“我的电脑不能处理这么大的文件..”/“不能一次用 Python 打开”并不能说明这个问题,如果你逐行阅读文件,我几乎可以肯定您的计算机可以处理该文件。
标签: python json dataframe import