【发布时间】:2018-01-28 02:39:57
【问题描述】:
我正在尝试计算列表中的每个单词。这样我就可以删除具有更大计数值的单词。但是我得到的输出不正确。 假设如果我的文件中有这些行“这是最好的时代,也是最糟糕的时代。这是智慧的时代,这是愚蠢的时代”。我的代码正在做什么打印(是,4)和再次某处(是,3)等等。每次出现单词时,它都会打印该单词,但计数值不同。我需要对每个单词进行一次计数。
for file in files:
print(file)
f=open(file, 'r')
content = f.read()
wordlist = content.split()
#print(wordlist)
wordfreq = [wordlist.count(w) for w in wordlist] # a list comprehension
print("List\n" + str(wordlist) + "\n")
print("Frequencies\n" + str(wordfreq) + "\n")
test = [i for i in wordfreq if i > 100]
print("result\n"+str(list(zip(test,wordlist))))
【问题讨论】:
标签: python list arraylist stop-words