熊猫数据框 - 根据列删除部分字符串[重复]答案

【问题标题】：Pandas dataframe - Remove part of string based on column [duplicate]熊猫数据框 - 根据列删除部分字符串[重复]
【发布时间】：2021-06-22 01:52:19
【问题描述】：

我想根据 col_b 删除 col_a 中的部分字符串。

前：

df = pd.DataFrame(np.array([['School 1 25 Queen Street','25 Queen Street'],['99 Main Street High School 2','99 Main Street']]), columns = ['Col a','Col b'])

Col_a	Col_b
School 1 25 Queen Street	25 Queen Street
99 Main Street High School 2	99 Main Street

我想在 col_a 中删除 col b 中的信息：

New_col_a
School 1
High School 2

我尝试了替换功能，但没有成功...

感谢您的帮助！

【问题讨论】：

使用->df['New_Col_a'] = df.apply(lambda x: x['Col_a'].replace(x['Col_b'], ''), 1)

标签： python pandas dataframe

【解决方案1】：

我们可以在 lambda 表达式中放置一个字符串替换，并将其应用于数据帧的每一行。

df['Col a'] = df.apply(lambda x: x['Col a'].replace(x['Col b'], ''), axis = 1)

【讨论】：