【发布时间】:2021-02-21 03:13:34
【问题描述】:
所以,我有一个巨大的 CSV 文件,看起来像:
PN,PCA Code,MPN Code,DATE_CODE,Supplier Code,CM Code,Fiscal YEAR,Fiscal MONTH,Usage,Defects
13-1668-01,73-2590,MPN148,1639,S125,CM1,2017,5,65388,0
20-0127-02,73-2171,MPN170,1707,S125,CM1,2017,9,11895,0
19-2472-01,73-2302,MPN24,1711,S119,CM1,2017,10,4479,0
20-0127-02,73-2169,MPN170,1706,S125,CM1,2017,9,7322,0
20-0127-02,73-2296,MPN170,1822,S125,CM1,2018,12,180193,0
15-14399-01,73-2590,MPN195,1739,S133,CM6,2018,11,1290,0
我想做的是按 PCA 代码对所有数据进行分组。因此,PCA 代码将具有一定数量的零件,这些零件将由某些 MPN 代码制造,我想要的最终嵌套 JSON 结构如下所示:
[
{
PCA: {
"code": "73-2590",
"CM": ["CM1", "CM6"],
"parts": [
{
"number": "13-1668-01",
"manufacturer": [
{
"id": "MPN148"
"info": [
{
"date_code": 1639,
"supplier": {
"id": "S125",
"FYFM": "2020-9",
"usage": 65388,
"defects": 0,
}
}
]
},
]
}
]
}
}
]
所以,我希望这种结构用于具有不同 MPN 和不同日期代码等的多个部件号 (PN)。
我目前正在使用 Pandas 来执行此操作,但我不知道如何进行嵌套。
到目前为止我的代码:
import json
import pandas as pd
dataframe = pd.read_csv('files/dppm_wc.csv')
data = {'PCAs': []}
for key, group in dataframe.groupby('PCA Code'):
for index, row in group.itterrows():
temp_dict = {'PCA Code': key, 'CM Code': row['CM Code'], 'parts': []}
with open('output.txt', 'w') as file:
file.write(json.dumps(data, indent=4))
如何继续实现我想要的嵌套 JSON 格式?有没有比我现在做的更好的方法?
【问题讨论】:
-
定义嵌套所需的信息不是数据文件中固有的。相反,这是你人为的强加。因此,您将需要手动编写嵌套逻辑。 “我被卡住了”不是 Stack Overflow 问题。