Pandas-Task03-分组

一、SAC

SAC指的是分组操作中的split-apply-combine过程;

其中split指基于某一些规则,将数据拆分成若干组,apply是指对每一组独立地使用函数,combine指将每一组的结果组合成某一类数据结构。

在改过程中,往往会遇到四类问题:

整合(Aggregation) —— 即分组计算统计量(如求均值、求每组元素个数)
变换(Transformation) —— 即分组对每个单元的数据进行操作(如元素标准化)
过滤(Filtration) —— 即按照某些规则筛选出一些组(如选出组内某一指标小于50的组)
综合问题 —— 即上面三种问题的混合。

二、group by函数

Pandas-Task03-分组

Pandas-Task03-分组
Pandas-Task03-分组
Pandas-Task03-分组
Pandas-Task03-分组
Pandas-Task03-分组
Pandas-Task03-分组
Pandas-Task03-分组

三、聚合、过滤和变换

Pandas-Task03-分组
Pandas-Task03-分组
Pandas-Task03-分组
Pandas-Task03-分组
Pandas-Task03-分组
Pandas-Task03-分组
Pandas-Task03-分组
Pandas-Task03-分组
Pandas-Task03-分组

四、apply函数

Pandas-Task03-分组

Pandas-Task03-分组
Pandas-Task03-分组

相关文章: