【发布时间】:2021-02-20 13:45:18
【问题描述】:
我有以下名为“places”的df
place_name
0 "Palais et bâtiments officiels[modifier | modifier le code]"
1 "Lieux de culte renommés[modifier | modifier le code]"
2 "Vestiges gallo-romains[modifier | modifier le code]"
如您所见,有一个类似的子字符串 [修饰符 |在places["place_name] 的所有输入中添加修饰符 le code],我想删除子字符串。
我尝试了以下两种技术
places["place_name"] = places["place_name"].apply(lambda x: re.sub("\\[modifier \\| modifier le code\\]", "", x))
places["places_name"] = places["place_name"].str.replace("[modifier | modifier le code]", "", regex=False)
这些都不起作用,因为我认为问题是我要删除的子字符串被另一个子字符串卡住了(注意开头没有空格)所以我认为代码本身不能将其识别为字符串.我一直在尝试使用 split() 方法拆分它,但我遇到了同样的问题,因为我要删除的字符串的开头没有空格。
最终输出应该是
place_name
0 "Palais et bâtiments officiels"
1 "Lieux de culte renommés"
2 "Vestiges gallo-romains"
我试图寻找其他解决方案但找不到任何解决方案,我知道有很多关于字符串的问题但找不到具体的解决方案。
【问题讨论】:
标签: python regex pandas string substring