【发布时间】:2021-07-23 06:10:06
【问题描述】:
我想计算文章中给定单词的出现次数。我尝试使用split的方法将文章切成n块,然后这样计算长度。
def get_occur(str, word):
lst = str.split(word)
return len(lst) - 1
但问题是,如果这个词是另一个词的子串,我总是会额外计算这个词。比如我只想统计这句话"I am very sad and she is a saddist"中"sad"的个数。应该是一个,但是因为“sad”是“saddist”的一部分,所以我会不小心算上它。如果我使用" sad ",我会省略句子开头和结尾的单词。另外,我正在处理大量的文章,所以我最好不必比较每个单词。我该如何解决这个问题?非常感谢。
【问题讨论】:
-
试试,
str_.split().count("sad")