pandas 对象拥有一组常用的数学和统计方法。 他们大部分都属于简约和汇总统计, 用于从Series中提取单个值(如sum或mean)

或从DataFrame的行或列中提取一个Series。跟对应的Numpy数组方法对比, 他们都是基于没有缺失数据的假设而构建的。

看例子:

pandas汇总和计算描述统计

 

sum方法

调用DataFrame的sum方法将会返回一个含有列小计的Series:

pandas汇总和计算描述统计

 

 行求和

传入axis=1 将会按行进行求和运算:

pandas汇总和计算描述统计

 

自动排除NA值

 除非整个切片(这里指的是行或列)都是NA。通过skipna选项可以禁用该功能:

 

 pandas汇总和计算描述统计

 

 pandas汇总和计算描述统计

 

间接统计(比如累加, 最大id等)

 pandas汇总和计算描述统计

 

 一次性产生多个汇总统计:describe

pandas汇总和计算描述统计

 

 

方法

 

pandas汇总和计算描述统计

 

 

d1.count() #非空元素计算
d1.min() #最小值
d1.max() #最大值
d1.idxmin() #最小值的位置,类似于R中的which.min函数
d1.idxmax() #最大值的位置,类似于R中的which.max函数
d1.quantile(0.1) #10%分位数
d1.sum() #求和
d1.mean() #均值
d1.median() #中位数
d1.mode() #众数
d1.var() #方差
d1.std() #标准差
d1.mad() #平均绝对偏差
d1.skew() #偏度
d1.kurt() #峰度
d1.describe() #一次性输出多个描述性统计指标

 

相关文章:

  • 2022-12-23
  • 2022-02-06
  • 2022-12-23
  • 2022-01-30
  • 2022-12-23
  • 2021-10-08
  • 2021-09-28
  • 2021-07-21
猜你喜欢
  • 2021-11-15
  • 2021-07-22
  • 2021-08-21
  • 2021-12-05
  • 2021-11-07
  • 2022-12-23
相关资源
相似解决方案