【问题标题】:Pandas dataframe - Remove part of string based on column [duplicate]熊猫数据框 - 根据列删除部分字符串[重复]
【发布时间】:2021-06-22 01:52:19
【问题描述】:

我想根据 col_b 删除 col_a 中的部分字符串。

前:

df = pd.DataFrame(np.array([['School 1 25 Queen Street','25 Queen Street'],['99 Main Street High School 2','99 Main Street']]), columns = ['Col a','Col b'])
Col_a Col_b
School 1 25 Queen Street 25 Queen Street
99 Main Street High School 2 99 Main Street

我想在 col_a 中删除 col b 中的信息:

New_col_a
School 1
High School 2

我尝试了替换功能,但没有成功...

感谢您的帮助!

【问题讨论】:

  • 使用->df['New_Col_a'] = df.apply(lambda x: x['Col_a'].replace(x['Col_b'], ''), 1)

标签: python pandas dataframe


【解决方案1】:

我们可以在 lambda 表达式中放置一个字符串替换,并将其应用于数据帧的每一行。

df['Col a'] = df.apply(lambda x: x['Col a'].replace(x['Col b'], ''), axis = 1)

【讨论】:

    猜你喜欢
    • 2016-10-18
    • 2014-07-09
    • 2019-01-28
    • 1970-01-01
    • 1970-01-01
    • 2017-09-09
    • 2021-12-02
    • 2021-01-11
    • 2017-10-04
    相关资源
    最近更新 更多