工作中我们时常会根据现有DataFrame的一些字段去创建新的字段,刚开始的时候,我的做法大多数是按照下面模式:
df[‘new_col’] = df.col.apply(lambda x: x …)
去创造新的字段,其实还有其他的好的一些做法。

下面我介绍下pandas的一些技巧去提高处理此类问题的效率。

  1. 利用’assign’函数一次性创建多个字段:
    Pandas技巧1--创建字段:一次性创建多个字段,及基于现有字段创建新的字段等
    下面可以看到,我不仅可以在现有字段上创建新的字段(beer_price, beer_onces),同时我们还能在刚刚创建的新字段中再次创造新的字段(beer_gallons)。
    Pandas技巧1--创建字段:一次性创建多个字段,及基于现有字段创建新的字段等

  2. 利用函数根据现有字段创建一串类似名字的字段:
    for col in df.columns:
    df[f’{col}_new’] = df[col].apply(my_function)
    Pandas技巧1--创建字段:一次性创建多个字段,及基于现有字段创建新的字段等

3.在特定的位置插入新的一列:
在country_fixed后面插入新的一列Pandas技巧1--创建字段:一次性创建多个字段,及基于现有字段创建新的字段等

相关文章:

  • 2022-12-23
  • 2022-12-23
  • 2022-12-23
  • 2021-08-14
  • 2021-10-01
  • 2021-10-26
  • 2021-11-19
  • 2021-09-14
猜你喜欢
  • 2021-04-24
  • 2021-06-05
  • 2021-06-23
  • 2022-12-23
相关资源
相似解决方案