【发布时间】:2020-05-25 14:53:53
【问题描述】:
我对一个非常大的数据集执行聚合。这是我的代码:
pipeline = [{"$match": {"Name_md_group": "ZEITUNGEN"}}, {"$group": {"_id": {"Name_freq": "$Name_freq"}, "total": {"$sum": "$Cost"}}}]
result = pd.DataFrame(list(collection.aggregate(pipeline)))
结果:
_id total
0 {'Name_freq': 'WOECHENTLICH FUENFMAL'} 2.074940e+07
1 {'Name_freq': 'SONSTIGE'} 2.284889e+07
2 {'Name_freq': 'WOECHENTLICH'} 8.522535e+07
3 {'Name_freq': 'TAEGLICH'} 3.700943e+07
4 {'Name_freq': 'WOECHENTLICH SECHSMAL'} 1.489394e+09
不知怎的,我得到了一个嵌套对象?为什么会这样,有没有办法摆脱它?列名_id 应为Name_freq。谁能帮帮我?
【问题讨论】:
标签: python python-3.x mongodb aggregation-framework pymongo