【问题标题】:nested json embeed in a column to csv python嵌套的json嵌入到csv python的列中
【发布时间】:2021-04-24 19:00:13
【问题描述】:

我正在处理从 mongo 集合中提取并导出为 csv 的数据清理工作。

数据框只有一列,每一行都嵌入了一个巨大的嵌套 json,我试图以多种方式提取特定字段,但似乎没有任何锻炼。

df    :    inputpayload
{
    "action": "val1",
    "action2": "val12",
    "date": "12012",
    "membership": [
        {
            "m1": "00",
            "m2": "001",
            "m3": "003",
            "m4": "005",
            "m5": "006",
            "group": [
                {
                    "g1": "a1",
                    "g2": "a2",
                    "g3": "a3",
                    "g4": "a4",
                    "g5": "a5",
                    "g6": "a6",
                    "g7": "a7",
                    "g9": "a10",
                    "data": [
                        {
                            "id": "xyz",
                            "code": "0012",
                            "fname": "abc",
                            "lname": "x",
                            "dob": "111280",
                            "sno": "234",
                            "bal": "2.3",
                            "cbal": "9.9"
                        }
                    ]
                }
            ]
        }
    ]
}


要提取的字段 = ["id","code","fname","dob","sno","bal",""cbal"]

想要的输出数据帧

id   code   fname  dob     sno  bal     cbal
xyz  0012   abc    111280  234  2.3      9.9

我想以更 Python 的方式做到这一点,任何解决方案/输入都将受到高度赞赏。

【问题讨论】:

标签: python json pandas python-2.7 dataframe


【解决方案1】:

将你的有效载荷设置为 d,然后

pd.DataFrame(d['membership'][0]['group'][0]['data'])


    id  code fname lname     dob  sno  bal cbal
0  xyz  0012   abc     x  111280  234  2.3  9.9

【讨论】:

  • 感谢您的回复,但如何将此逻辑应用于整个数据框
  • 您没有发布数据框。这只是一本字典。如果您可以发布几行数据框,我可以看看。除非您说其中有一列需要转换。
猜你喜欢
  • 1970-01-01
  • 2021-07-26
  • 1970-01-01
  • 2013-10-20
  • 2020-07-06
  • 2018-08-10
  • 2016-06-28
  • 2021-02-21
  • 1970-01-01
相关资源
最近更新 更多