【发布时间】:2014-02-19 13:49:22
【问题描述】:
这一定很简单,但不知何故我想念它。我有代码:
import nltk
f=open('...\\t.txt','rU')
raw=f.read()
tokens = nltk.word_tokenize(raw)
print nltk.pos_tag(tokens)
例如返回:
"[('processes', 'NNS'), ('a', 'DT'), ('sequence', 'NN'), ('of', 'IN'), ('words', 'NNS')]
我想知道如何只收集所有的 'NN' 例如或所有的 'DT' AND 'IN' 而不是字符串的每个成员。
提前致谢
【问题讨论】:
标签: python filter nltk pos-tagger