NLTK错误加载模块[重复]答案

【问题标题】：NLTK error loading module [duplicate]NLTK错误加载模块[重复]
【发布时间】：2016-11-06 19:16:59
【问题描述】：

我正在尝试运行此代码：

import nltk


text = "Mrs. Hudson made a cup of tea. She is a wonderful woman."
sentences = nltk.tokenize.sent_tokenize(text)#breaks statement into       
print sentences
#print tokens
tokens = [nltk.tokenize.word_tokenize(s) for s in sentences]#tokenizes sentences passes as list of lists

PosTokens = [nltk.pos_tag(e) for e in tokens]

当我运行它时，我得到一个错误：

Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
NameError: name 'averaged_perceptron_tagger' is not defined

所以我运行下载器来获取标记器，根据这个问题，我需要“maxtent_treebank_pos_tagger” nltk pos_tag usage

我得到以下信息：

nltk.download('maxtent_treebank_pos-tagger')

NameError: name 'averaged_perceptron_tagger' is not defined
>>> nltk.download('maxtent_treebank_pos-tagger')
[nltk_data] Error loading maxtent_treebank_pos-tagger: Package
[nltk_data]     'maxtent_treebank_pos-tagger' not found in index
False

所以我很难过感谢大家的帮助！！！

【问题讨论】：

您的问题是一个错字：它是“maxent”（最大熵），而不是“maxtent”。
[nltk_data] 加载 maxent 时出错：在索引 False 中找不到包“maxent”
@alvas 这是一个关于拼写错误的问题，而不是关于如何使用标记器的重复问题。