【发布时间】:2023-03-24 05:33:01
【问题描述】:
我试图删除 pandas 中的重复字符串,但该方法不起作用。
我的尝试
import pandas as pd
ser = pd.Series(['haha','lollol','hi'])
ser.str.replace(r'(\w)\1',r'\1',regex=True) # does not work
But this works:
re.sub(r'(\w+)\1',r'\1', 'haha') # gives ha
pandas系列中如何去除每个单词中的重复字符串?
【问题讨论】:
-
这不是熊猫系列独有的吧?您可能可以将问题更改为仅删除重复的子字符串。
-
@AlexanderCécile 我的数据已经在熊猫数据框中,我想做一些字符串操作。显然我可以做 re.sub for-loop 但我正在寻找更通用的 pandaic 方式来做到这一点。