【发布时间】:2020-09-06 16:06:31
【问题描述】:
我收到了单个 JSON(500 个 JSON)并通过 append() 方法将它们添加到现有列表的末尾进行了修改。
d_path = r'--PATH HERE--'
d_files = [f for f in listdir(d_path) if isfile(join(d_path,f))]
n = num_data
d_dicts=[]
for counter,d_file in enumerate(d_files):
with open(d_path+'\\'+d_file,encoding="utf8") as json_data:
d_dicts.append(json.load(json_data))
if counter == num_data:
break
在这一步之后,我尝试使用 json_normalize 将 JSON 数据标准化为一个平面表(Pandas DataFrame,总共 500 行)。
df = json_normalize(d)
其他信息:
class 'pandas.core.frame.DataFrame'
dtypes: float64(8), int64(3), object(9)
到目前为止,除了一列之外,它运行良好。我最终得到了一列,每行都有一个字典列表。我试图寻找解决方案,但找不到对我有帮助的解决方案。 每行都有一个嵌套字典。
这是一个名为 Info_column 的列的三行示例,其中包含虚构数据但结构相同:
Info_column
[{**'Greeting':** 'Good day', 'Group': '1.2', 'Window': None,
'Value1': 17.0, 'Value2': 13.23, 'Value3': 11.0,
'Date1': '2013-09-04', 'Date2': '2012-09-05', 'Date3': '2015-07-22',
'Married': False, 'Country': None,
'Person': [{'Age': '25', 'Number': '82', 'Value4': 19.2,
'Column1': None, 'Column2': None, 'Column3': None, 'Column4': None}]}]
[{'Greeting': 'Good afternoon', 'Group': '1.4', 'Window': None,
'Value1': 12.0, 'Value2': 9.23, 'Value3': 2.0,
'Date1': '2016-09-04', 'Date2': '2016-09-16', 'Date3': '2016-07-05',
'Married': True, 'Country': Germany,
'Person': [{'Age': '30', 'Number': '9', 'Value4': 10.0,
'Column1': None, 'Column2': None, 'Column3': None, 'Column4': None}]}]
[{'Greeting': 'Good evening', 'Group': '3.0', 'Window': True,
'Value1': 24.0, 'Value2': 15.5, 'Value3': 2.0,
'Date1': '2019-02-01', 'Date2': '2019-05-05', 'Date3': '2018-05-03',
'Married': False, 'Country': Spain,
'Person': [{'Age': '24', 'Number': '12', 'Value4': 8.2,
'Column1': None, 'Column2': None, 'Column3': None, 'Column4': None}]}]
正确的方法是什么?
我的目标是将此列中每一行的信息作为我的数据框中的附加列。
我需要的列作为我的 DataFrame df 中其他列旁边的附加列:
Greeting, Group, Window, Value1, Value2, Value3, Date1, Date2, Date3, Married, Country, Person_Age, Person_Number, Person_Value4, Person_Column1, Person_Column2, Person_Column3, Person_Column4
非常感谢您的帮助
问候, 爱丽儿
【问题讨论】:
-
输入似乎不是有效的 python 格式。实际上,这三行并没有包含在更大的列表或结构中。
Info_column实际上是一个 pandas 数据框列? -
嗨,Alexandre,我在问题中添加了第一步。希望对您有所帮助,给您带来的困惑深表歉意。在使用 append() 方法将所有 JSON 放在一个列表中并使用 json_normalize 之后,它在除下面显示的列之外的所有列上都运行良好。每行都有一个嵌套字典,我不知道如何解决这个问题
标签: python json pandas normalize