【发布时间】:2021-07-13 18:42:16
【问题描述】:
除了列表推导之外,是否有更快的方法从集合中过滤项目,列表推导运行时间对于大型数据集来说有点慢。
我已经将list_stopwords 转换为集合,与列表相比,这需要更少的时间。
date description
0 2018-07-18 payment receipt
1 2018-07-18 ogsg s.u.b.e.b june 2018 salar
2 2018-07-18 sal admin charge
3 2018-07-19 sms alert charge outstanding
4 2018-07-19 vat onverve*issuance
list_stopwords = set(stop_words.get_stop_words('en'))
data['description'] = data['description'].apply(lambda x: " ".join([word for word in x.split() if word not in (list_stopwords)]))
【问题讨论】: