删除描述列DataFrame中的特殊字符

【问题标题】：Remove special character in the description column DataFrame删除描述列DataFrame中的特殊字符
【发布时间】：2021-12-15 20:41:40
【问题描述】：

我在 DataFrame 上使用正则表达式。我的表达式匹配如下行：[*, *,___,” "] 如您在此描述中所见：

df["Description"].str.extract("Localisation[\s]*:.*\n([^_\n]*)\n").value_counts()

如何修改我的表达式以删除这些行？

【问题讨论】：

【解决方案1】：

试试这个：

df["Description"] = df["Description"].apply(lamda x: ''.join([s for s in x if s.isalnum() or s.isspace()]))

或者，如果您只想删除特定值：

values = ["*", "_"," "]
df["Description"] = df["Description"].apply(lamda x: ''.join([s for s in x if x not in values]))

【讨论】：

我试试这张地图(lambda x:x if x not in values,df["Description"].str.extract(r"Localisation[\s]*:.*\n([^ _\n]*)\n"))
我有错误消息：文件“”，第 37 行 map(lambda x:x if x not in values,df["Description"].str.extract (r"Localisation[\s]*:.*\n([^_\n]*)\n")) ^ SyntaxError: invalid syntax