【发布时间】:2019-08-15 18:06:51
【问题描述】:
我知道
test = []
for item in my_texts:
test.append(item.encode('ascii', 'ignore').decode('ascii'))
从列表中删除表情符号。但是如何从数据框中删除表情符号?当我尝试
a = []
for item in goldtest['Text']:
a.append(item.encode('ascii', 'ignore').decode('ascii'))
我只得到了 goldtest 的最后一个条目。当我在整个数据框上尝试代码时,我得到 ''AttributeError: 'DataFrame' object has no attribute 'encode'''
【问题讨论】:
-
DataFrame 不是字符串。所以问问自己,你实际上调用的是什么
encode,因为你的错误表明它是一个 DataFrame -
这种模式不仅会删除“表情符号”,还会删除所有重音字符、非拉丁字母和标点符号以及一些更常见的符号 - 有效地破坏您拥有的任何文本数据。