【发布时间】:2021-04-24 19:00:13
【问题描述】:
我正在处理从 mongo 集合中提取并导出为 csv 的数据清理工作。
数据框只有一列,每一行都嵌入了一个巨大的嵌套 json,我试图以多种方式提取特定字段,但似乎没有任何锻炼。
df : inputpayload
{
"action": "val1",
"action2": "val12",
"date": "12012",
"membership": [
{
"m1": "00",
"m2": "001",
"m3": "003",
"m4": "005",
"m5": "006",
"group": [
{
"g1": "a1",
"g2": "a2",
"g3": "a3",
"g4": "a4",
"g5": "a5",
"g6": "a6",
"g7": "a7",
"g9": "a10",
"data": [
{
"id": "xyz",
"code": "0012",
"fname": "abc",
"lname": "x",
"dob": "111280",
"sno": "234",
"bal": "2.3",
"cbal": "9.9"
}
]
}
]
}
]
}
要提取的字段 = ["id","code","fname","dob","sno","bal",""cbal"]
想要的输出数据帧
id code fname dob sno bal cbal
xyz 0012 abc 111280 234 2.3 9.9
我想以更 Python 的方式做到这一点,任何解决方案/输入都将受到高度赞赏。
【问题讨论】:
标签: python json pandas python-2.7 dataframe