【发布时间】:2021-07-21 08:11:26
【问题描述】:
目的:清理我的 pandas 数据框中的 OneCol 列。 我做了什么:我导入了 NLTK,然后运行了这段代码:
import nltk
import collections
from nltk.corpus import words
for value in df_US['OneCol']:
if value in words.words():
df_US['Result']=df_US['Result'].iloc.append(value)
我也试过这个:
#df_US['Result'] = df_US[['OneCol']].apply(lambda x: x.words.words())
没有成功!
我的数据如下所示:
谢谢你,感谢你给我的任何建议。
【问题讨论】:
-
分享你的数据框
df_US -
不要分享截图,而是分享代码中的数据框
-
所提供的值的预期结果是什么 - “好”、“xxxx”和“我喜欢编码”?
-
嗨亚历山德拉,我想删除那些输入无效单词/胡言乱语的人。在这种情况下,代码 2,xxxxx
标签: pandas for-loop lambda nltk