【发布时间】:2016-11-06 19:16:59
【问题描述】:
我正在尝试运行此代码:
import nltk
text = "Mrs. Hudson made a cup of tea. She is a wonderful woman."
sentences = nltk.tokenize.sent_tokenize(text)#breaks statement into
print sentences
#print tokens
tokens = [nltk.tokenize.word_tokenize(s) for s in sentences]#tokenizes sentences passes as list of lists
PosTokens = [nltk.pos_tag(e) for e in tokens]
当我运行它时,我得到一个错误:
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
NameError: name 'averaged_perceptron_tagger' is not defined
所以我运行下载器来获取标记器,根据这个问题,我需要“maxtent_treebank_pos_tagger” nltk pos_tag usage
我得到以下信息:
nltk.download('maxtent_treebank_pos-tagger')
NameError: name 'averaged_perceptron_tagger' is not defined
>>> nltk.download('maxtent_treebank_pos-tagger')
[nltk_data] Error loading maxtent_treebank_pos-tagger: Package
[nltk_data] 'maxtent_treebank_pos-tagger' not found in index
False
所以我很难过感谢大家的帮助!!!
【问题讨论】:
-
您的问题是一个错字:它是“maxent”(最大熵),而不是“maxtent”。
-
[nltk_data] 加载 maxent 时出错:在索引 False 中找不到包“maxent”
-
@alvas 这是一个关于拼写错误的问题,而不是关于如何使用标记器的重复问题。