【发布时间】:2020-06-17 19:13:55
【问题描述】:
我有一个这样的数据框,
col1 col2 col3
1 2 3
2 3 4
4 2 3
7 2 8
8 3 4
9 3 3
15 1 12
现在我想对两个连续 col1 行之间差异小于 3 的行进行分组。并对其他列值求和,用组的最后一个值创建另一列(col4), 所以最终的数据框看起来像,
col1 col2 col3 col4
1 7 10 4
7 8 15 9
使用 for 循环来做这件事很乏味,寻找一些 pandas 的快捷方式来最有效地做这件事。
【问题讨论】:
-
由于最后两行之间的差异也大于 3 (6),因此您不应该在输出中有第三行吗?
-
@cs95 是的,第三行会在那里