【发布时间】:2020-12-22 18:20:32
【问题描述】:
我想知道如何从如下列表中删除特定单词,包括停用词:
my_list=[[],
[],
['A'],
['SB'],
[],
['NMR'],
[],
['ISSN'],
[],
[],
[],
['OF', 'USA'],
[],
['THE'],
['HOME'],
[],
[],
['STAR'],
[]]
如果它是一个字符串列表,我会应用如下内容:
from collections import Counter
stop_words = stopwords.words('english')
text = ' '.join([word for word in my_list if word not in stop_words])
我需要在最后做这样的事情:
counts= Counter(chain.from_iterable(my_list))
plt.bar(*zip(*counts.most_common(20)))
plt.show()
预计要绘制的列表:
my_list=[[],
[],
['SB'],
[],
['NMR'],
[],
['ISSN'],
[],
[],
[],
['USA'],
[],
['HOME'],
[],
[],
['STAR'],
[]]
【问题讨论】:
-
那么预期的输出是什么? Counter 与删除单词有什么关系?
-
我从列表中删除了计数器。现在可能它应该更好。我添加了一个输出示例(用于列表),以便绘制它
标签: python stop-words