合并数据集

pandas可以通过内置方式进行合并

pandas.merge  根据键不同  将DataFrame中的行连接起来

pandas.concat沿着 一条轴将多个对象堆叠到一起

实例方法  combine_first 可以将重复数据编接在一起


数据库风格的DataFrame合并

使用pd.merge函数, 使用on参数指定键

默认情况下,取交集。通过 how 设置 取并集

python数据分析第8天 数据规整化:清理,转换,合并,重塑

合并  索引会被丢弃

python数据分析第8天 数据规整化:清理,转换,合并,重塑

python数据分析第8天 数据规整化:清理,转换,合并,重塑


索引上的合并

传入left_index=True  或者   right_index=True     说明索引应该被用作连接键


对于层次化索引需要指明用做合并键的多个列


还支持join


轴向连接

python数据分析第8天 数据规整化:清理,转换,合并,重塑

默认情况下,concat 函数 在axis=0  上工作,产生一个Series    axis=1  产生DataFrame

python数据分析第8天 数据规整化:清理,转换,合并,重塑


合并重叠数据

可以使用np.where       相当于一种矢量化的if-else

python数据分析第8天 数据规整化:清理,转换,合并,重塑

对于DataFrame    combine_first 也会做同样的事情,可以看做打补丁

python数据分析第8天 数据规整化:清理,转换,合并,重塑


重塑和轴向旋转


python数据分析第8天 数据规整化:清理,转换,合并,重塑


????


将长格式  旋转 为 宽格式

对ldata 进行转换

python数据分析第8天 数据规整化:清理,转换,合并,重塑

前面两个参数 用作行和列索引的列名,最后一个参数则是用于填充DataFrame的数据列的列名

忽略最后一个参数,就会得到有层次化


数据转换

移除重复数据

duplicated方法返回一个布尔型Series,表示各行是否是重复行

而drop_duplicated  方法  移除重复行


利用函数或映射进行数据转换

python数据分析第8天 数据规整化:清理,转换,合并,重塑


替换值
























































相关文章:

  • 2022-02-21
  • 2021-05-31
  • 2022-01-15
  • 2022-12-23
  • 2021-05-26
猜你喜欢
  • 2022-12-23
  • 2021-10-20
  • 2022-12-23
  • 2018-04-12
  • 2021-06-26
  • 2021-09-18
相关资源
相似解决方案