【发布时间】:2018-03-27 23:10:43
【问题描述】:
我有一个熊猫系列(作为更大数据框的一部分),如下所示:
0 7416
1 10630
2 7086
3 2091
4 3995
5 1304
6 519
7 1262
8 3676
9 2371
10 5346
11 912
12 3653
13 1093
14 2986
15 2951
16 11859
我想根据以下分位数对行进行分组:
Top 0-5%
Top 6-10%
Top 11-25%
Top 26-50%
Top 51-75%
Top 76-100%
首先我开始对数据使用pd.rank(),然后我计划使用pd.cut() 将数据切割成箱,但这似乎不接受前N%,而是接受明确的箱边缘。在 pandas 中是否有一种简单的方法可以做到这一点,或者我是否需要创建一个 lambda/apply 函数来计算每个排名项目应该放在哪个 bin 中。
【问题讨论】: