【发布时间】:2019-08-31 20:05:05
【问题描述】:
我有两个数据框 df1 和 df2:
- df1 有 column1、column2 并且它有很多行(~1000 万)
- df2 有 column2,还有很多其他列,而且很短(~ 100 列和~ 1000 行)
我想要实现的是:
df1.merge(df2, on=column2).groupby(column1).agg($SomeAggregatingFunction)
但要避免合并操作,因为它会占用大量内存。
有什么方法可以获得这种行为?
【问题讨论】:
标签: python pandas pandas-groupby