【发布时间】:2020-02-22 01:57:11
【问题描述】:
我有一个字符串列表。我想计算 Pandas 列的每一行中所有单词的出现次数,并用这个计数添加一个新列。
words = ["I", "want", "please"]
data = pd.DataFrame({"col" : ["I want to find", "the fastest way", "to
count occurrence", "of words in a column", "Can you help please"]})
data["Count"] = data.col.str.count("|".join(words))
print(data)
此处显示的代码完全符合我的要求,但运行长文本和长单词列表需要很长时间。你能建议一种更快的方法来做同样的事情吗?
谢谢
【问题讨论】: