【发布时间】:2019-11-21 20:33:31
【问题描述】:
我正在清理具有以下内容的数据集:
[输入]
my_Series = pd.Series(["-","ASD", "711-AUG-M4G","Air G2G", "Karsh"])
my_Series.str.replace("[^a-zA-Z]+", " ")
[输出]
0
1 ASD
2 AUG M G
3 Air G G
4 Karsh
[理想输出]
0
1 ASD
2 AUG M4G
3 Air G2G
4 Karsh
我的目标是删除特殊字符和数字,但它有一个包含字母数字的单词,它应该保留。有人可以帮忙吗?
【问题讨论】:
-
您的输入和输出数据之间存在相当大的差异。你能澄清一下吗?
-
@TimBiegeleisen,对此感到抱歉。我更新了代码以使其更有意义。我创建了一个列表并将其转换为 pandas 系列以使用导致 OUT 的正则表达式获取和替换,但我想要的是保留基于 [IDEAL OUT] 的字母数字单词
标签: regex python-3.x pandas