csv 到复杂的嵌套 json答案

【问题标题】：csv to complex nested jsoncsv 到复杂的嵌套 json
【发布时间】：2021-02-21 03:13:34
【问题描述】：

所以，我有一个巨大的 CSV 文件，看起来像：

PN,PCA Code,MPN Code,DATE_CODE,Supplier Code,CM Code,Fiscal YEAR,Fiscal MONTH,Usage,Defects
13-1668-01,73-2590,MPN148,1639,S125,CM1,2017,5,65388,0
20-0127-02,73-2171,MPN170,1707,S125,CM1,2017,9,11895,0
19-2472-01,73-2302,MPN24,1711,S119,CM1,2017,10,4479,0
20-0127-02,73-2169,MPN170,1706,S125,CM1,2017,9,7322,0
20-0127-02,73-2296,MPN170,1822,S125,CM1,2018,12,180193,0
15-14399-01,73-2590,MPN195,1739,S133,CM6,2018,11,1290,0

我想做的是按 PCA 代码对所有数据进行分组。因此，PCA 代码将具有一定数量的零件，这些零件将由某些 MPN 代码制造，我想要的最终嵌套 JSON 结构如下所示：

[
    {
        PCA: {
            "code": "73-2590",
            "CM": ["CM1", "CM6"],
            "parts": [
                {
                    "number": "13-1668-01",
                    "manufacturer": [
                        {
                            "id": "MPN148"
                            "info": [
                                {
                                    "date_code": 1639,
                                    "supplier": {
                                        "id": "S125",
                                        "FYFM": "2020-9",
                                        "usage": 65388,
                                        "defects": 0,
                                    }
                                }
                            ]
                        },
                    ]
                }
            ]
        }
    }
]

所以，我希望这种结构用于具有不同 MPN 和不同日期代码等的多个部件号 (PN)。

我目前正在使用 Pandas 来执行此操作，但我不知道如何进行嵌套。

到目前为止我的代码：

import json
import pandas as pd

dataframe = pd.read_csv('files/dppm_wc.csv')

data = {'PCAs': []}

for key, group in dataframe.groupby('PCA Code'):
    for index, row in group.itterrows():
        temp_dict = {'PCA Code': key, 'CM Code': row['CM Code'], 'parts': []}

with open('output.txt', 'w') as file:
    file.write(json.dumps(data, indent=4))

如何继续实现我想要的嵌套 JSON 格式？有没有比我现在做的更好的方法？

【问题讨论】：

定义嵌套所需的信息不是数据文件中固有的。相反，这是你人为的强加。因此，您将需要手动编写嵌套逻辑。 “我被卡住了”不是 Stack Overflow 问题。

标签： python json pandas csv

【解决方案1】：

我不太明白你想用这个结构做什么，但我想它可以用这样的东西来实现

data = {'PCAs': []}

for key, group in df.groupby('PCA Code'):
    temp_dict = {'PCA Code': key, 'CM Code': [], 'parts': []}
    for index, row in group.iterrows():
        temp_dict['CM Code'].append(row['CM Code'])
        temp_dict['parts'].append(
            {'number': row['PN'], 
             'manufacturer': [
                 {
                     'id': row['MPN Code'], 
                     'info': [
                         {
                             'date_code': row['DATE_CODE'], 
                             'supplier': {'id': row['Supplier Code'], 
                                          'FYFM': '%s-%s' % (row['Fiscal YEAR'], row['Fiscal MONTH']), 
                                          'usage': row['Usage'], 
                                          'defects': row['Defects']}
                         }
                     ]
                 }]
             }
        )
    data['PCAs'].append(temp_dict)

【讨论】：