【发布时间】:2014-01-06 22:48:28
【问题描述】:
我有来自这个link 的代码。它返回 POS 标签及其出现次数。 我将如何实现一个代码,而不是输入一个标签,而是输入一个句子,它会返回其中的单词以及基于语料库(在本例中为 Brown 语料库)的每个单词的不同 pos 标签。
def findtags(tag_prefix, tagged_text):
cfd = nltk.ConditionalFreqDist((tag, word) for (word, tag) in tagged_text
if tag.startswith(tag_prefix))
return dict((tag, cfd[tag].keys()[:5]) for tag in cfd.conditions())
tagdictNNS = findtags('NNS', nltk.corpus.brown.tagged_words())
for tag in sorted(tagdictNNS):
print tag, tagdictNNS[tag]
for k,v in tagdictNNS.items():
new[k] = len(tagdictNNS[k])
print new
【问题讨论】: