第一、qcut将等分位数方法,将数据集分成指定的n个部分;比如说10,那么就会将原始数据集分成10个数量相同的部分,并有对应的区间;每个区间为一个类;

代码如下所示:
data=pd.DataFrame(np.random.randn(50,5),columns=list('abcde'))
data['qcut']=pd.qcut(data.a,10)
print(pd.qcut(data.a,10))
print(data.head())

输出如图所示:
qcut的作用

data['qcut']=pd.qcut(data.a,10)这句代码返回的是每个a值所属的类别,所以长度等同于a的个数;

再看附加:
print(data.groupby(['qcut'])[['b']].agg(['mean','median','count']))

输出结果:
qcut的作用

相关文章:

  • 2022-12-23
  • 2021-10-09
  • 2022-12-23
  • 2021-06-19
  • 2022-02-09
  • 2021-11-22
  • 2022-12-23
猜你喜欢
  • 2021-11-13
  • 2022-02-28
  • 2021-12-09
  • 2022-12-23
  • 2021-08-01
  • 2022-01-20
  • 2021-12-26
相关资源
相似解决方案