在数据处理过程中,由于需要对数据进行分类统计,在使用sql时,由于后续重复性动作的实现,改用python进行处理。
1、由于数据缺少缺失值,未做缺失值处理:

  1. 在使用sql时,分组结果正常。维度为9x5
    python分组和sql分组遇到的坑

  2. 使用Python时,发现数据组别减少.6x5
    python分组和sql分组遇到的坑
    2、数据缺失值处理后,分组正常。
    python分组和sql分组遇到的坑
    通过最后检验,发现Python在分组时, 会自动忽略掉带有空值的行对其剩余的部分进行分组统计。
    故,在使用python分组时,先对缺失值进行处理,在进行分组。

相关文章: