【发布时间】:2021-12-13 17:02:54
【问题描述】:
我正在尝试在 Python 3 中(通过 Jupyter)分隔一个平面 json 文件,以便创建一个额外的列。 Pandas 自动读取并生成“...”之间的行。当我在没有分隔符的情况下打印时,它会很好地读取文件。这里是前四行:
0 <h1>lorum ipsum|
1 <h2>lorum ipsum|
2
3 <h5>lorum ipsum...
但是,每次 json 有文件 a > 时,我都想分隔一个额外的列,但是我收到一个我不理解的广泛错误。我做错了什么?
---------------------------------------------------------------------------
TypeError Traceback (most recent call last)
<ipython-input-38-647ecd72fd56> in <module>
1 import sys
2 import pandas as pd
----> 3 df = pd.read_json('/filepath/doc.json' , delimiter='>', engine='python', header=None)
4 print (df)
~/opt/anaconda3/lib/python3.8/site-packages/pandas/util/_decorators.py in wrapper(*args, **kwargs)
197 else:
198 kwargs[new_arg_name] = new_arg_value
--> 199 return func(*args, **kwargs)
200
201 return cast(F, wrapper)
~/opt/anaconda3/lib/python3.8/site-packages/pandas/util/_decorators.py in wrapper(*args, **kwargs)
297 )
298 warnings.warn(msg, FutureWarning, stacklevel=stacklevel)
--> 299 return func(*args, **kwargs)
300
301 return wrapper
TypeError: read_json() got an unexpected keyword argument 'delimiter'
产生错误的代码是:
import pandas as pd
df = pd.read_json('/path/file.json' , delimiter='>', engine='python', header=None)
print (df)
【问题讨论】:
-
documentation 概述了您可以与
pd.read_json和delimiter一起使用的参数,engine和header不是其中之一。 -
加载数据后需要拆分列。
-
能否添加一个小样本 JSON 文件进行测试?
标签: python json pandas delimiter