【发布时间】:2019-06-24 11:09:30
【问题描述】:
我正在尝试删除我的 pandas 数据框中的标点符号和数字。这是我的代码示例:
import re
import string
df.text = df.text.apply(lambda x: x.lower())
df.text = df.text.apply(lambda x: x.translate(None, string.punctuation))
它给了我错误:
TypeError: translate() 只接受一个参数(给定 2 个)
我试图在翻译中删除 None 所以它变成:
df.text = df.text.apply(lambda x: x.translate(string.punctuation))
它没有给我任何错误,但是这段代码没有按照我的意愿删除标点符号。我正在使用python 2.7。你能帮助我吗 ?提前谢谢你
【问题讨论】:
-
你的正则表达式在哪里?
-
@Tomothy32,抱歉,我刚刚编辑了我的问题。
-
要删除标点符号吗?
-
你确定你使用的是python 2.7吗?
-
@MohitMotwani 是的,我想删除列中的标点符号。我实际上是在使用带有 python 2 的 jupyter notebook
标签: python pandas python-2.7 dataframe