【发布时间】:2017-04-29 20:00:11
【问题描述】:
我有一个包含两列的数据框。
data=DataFrame({'a':[1,2,1,4,1,1,3,1,4,1,1,1],'b':[5,2,8,3,10,3,5,15,45,41,23,9]})
a b
0 1 5
1 2 2
2 1 8
3 4 3
4 1 10
5 1 3
6 3 5
7 1 15
8 4 45
9 1 41
10 1 23
11 1 9
我想根据 Column 'a' 的值超过给定阈值将 DataFrame 划分为组。在这种情况下,阈值是 3,所以每当“a”列超过 3 的值时,我都想要一个新组。
我希望我的小组看起来像这样
a b
0 1 5
1 2 2
2 1 8
a b
0 4 3
1 1 10
2 1 3
3 3 5
4 1 15
a b
0 4 45
1 1 41
2 1 23
3 1 9
我唯一能想到的就是应用 cummax
data['max']=data.b.cummax()
但他的意志只适用于大于 3 的值总是变大的有限情况。
【问题讨论】: