【发布时间】:2019-01-30 15:48:27
【问题描述】:
我正在清理 pandas 数据框中的一列,以删除包含某些字符的垃圾用户名。示例如下:
d = {'username': ["11111", "222!22", "21212!", "85511$", "8552$", "115522@@"]}
df = pd.DataFrame(data=d)
username
0 11111
1 222!22
2 21212!
3 85511$
4 8552$
5 115522@@
....
我正在使用以下内容,它按预期工作:
df[~df['username'].str.contains('~|`|!|@|#|\$|%|\^|&|\*|\(|\)|-|_|\+|=|{|\[|}|]|:|;|"|\'|<|,|>|\.|/|\?')]
但我想再添加两个字符:
\ 和 |
当我尝试为\ 添加\\ 和为\| 添加| 时,我收到错误消息。我该怎么办?
【问题讨论】:
-
尝试
\\\\和\\|或r'~|`|!|@|#|\$|%_and_so_on'的原始字符串(r 在打开引号之前)。 -
这行得通。 @Psytho
标签: python python-3.x string pandas