【发布时间】:2021-07-07 21:45:53
【问题描述】:
我有一个类似的数据框
df = pd.DataFrame({'time': [1, 5, 100, 250, 253, 260, 700], 'qty': [3, 6, 2, 5, 64, 2, 5]})
df['time_delta'] = df.time.diff()
我想对time_delta 进行分组,以便将time_delta 小于10 的所有行组合在一起,可以删除time_delta 列,并对qty 求和。
预期结果是
pd.DataFrame({'time': [1, 100, 250, 700], 'qty': [9, 2, 71, 5]})
基本上我希望有类似df.groupby(time_delta_func(10)).agg({'time': 'min', 'qty': 'sum'}) func 的东西。我阅读了pd.Grouper,但似乎基于时间的分组非常严格且基于间隔。
【问题讨论】: