【发布时间】:2020-08-05 09:47:54
【问题描述】:
我有一个如下图所示的数据框
B_ID Session no_show cumulative_no_show
1 s1 0.4 0.4
2 s1 0.6 1.0
3 s1 0.2 1.2
4 s1 0.1 1.3
5 s1 0.4 1.7
6 s1 0.2 1.9
7 s1 0.3 2.2
10 s2 0.3 0.3
11 s2 0.4 0.7
12 s2 0.3 1.0
13 s2 0.6 1.6
14 s2 0.2 1.8
15 s2 0.5 2.3
其中,cumulative_no_show 是 no_show 的累积和。
根据以上条件,我想创建一个名为 u_no_show 的新列。
每当累积无显示 >= 0.8 时,从下一个累积无显示中减 1。等等。
预期输出:
B_ID Session no_show cumulative_no_show u_no_show
1 s1 0.4 0.4 0.4
2 s1 0.6 1.0 1.0
3 s1 0.2 1.2 0.2
4 s1 0.1 1.3 0.3
5 s1 0.4 1.7 0.7
6 s1 0.2 1.9 0.9
7 s1 0.3 2.2 0.2
10 s2 0.3 0.3 0.3
11 s2 0.4 0.7 0.7
12 s2 0.3 1.0 1.0
13 s2 0.6 1.6 0.6
14 s2 0.2 1.8 1.8
15 s2 0.5 2.3 0.3
【问题讨论】:
标签: pandas numpy pandas-groupby numba