【发布时间】:2018-08-09 21:09:26
【问题描述】:
我有一个 .json 文件,其中每一行都是一个对象。例如,前两行是:
{"review_id":"x7mDIiDB3jEiPGPHOmDzyw","user_id":"msQe1u7Z_XuqjGoqhB0J5g","business_id": ...}
{"review_id":"dDl8zu1vWPdKGihJrwQbpw","user_id":"msQe1u7Z_XuqjGoqhB0J5g","business_id": ...}
我曾尝试使用 ijson lib 进行如下处理:
with open(filename, 'r') as f:
objects = ijson.items(f, 'columns.items')
columns = list(objects)
但是,我得到错误:
JSONError: Additional data
这似乎是由于多个对象我收到这样的错误。
在 Jupyter 中分析此类 Json 文件的推荐方法是什么?
提前谢谢你
【问题讨论】:
-
你的整个文件真的是有效的 json 吗?还是只有每一行有效的json?
-
如果没有更具体的 json,我无法给出答案,但您可以尝试通过使用
,分隔 json 对象并将它们包装在[]中来将其转换为列表 -
似乎每一行都是一个有效的 json 并且有数百万行。