【问题标题】:NLTK error loading module [duplicate]NLTK错误加载模块[重复]
【发布时间】:2016-11-06 19:16:59
【问题描述】:

我正在尝试运行此代码:

import nltk


text = "Mrs. Hudson made a cup of tea. She is a wonderful woman."
sentences = nltk.tokenize.sent_tokenize(text)#breaks statement into       
print sentences
#print tokens
tokens = [nltk.tokenize.word_tokenize(s) for s in sentences]#tokenizes sentences passes as list of lists

PosTokens = [nltk.pos_tag(e) for e in tokens]

当我运行它时,我得到一个错误:

Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
NameError: name 'averaged_perceptron_tagger' is not defined

所以我运行下载器来获取标记器,根据这个问题,我需要“maxtent_treebank_pos_tagger” nltk pos_tag usage

我得到以下信息:

nltk.download('maxtent_treebank_pos-tagger')

NameError: name 'averaged_perceptron_tagger' is not defined
>>> nltk.download('maxtent_treebank_pos-tagger')
[nltk_data] Error loading maxtent_treebank_pos-tagger: Package
[nltk_data]     'maxtent_treebank_pos-tagger' not found in index
False

所以我很难过感谢大家的帮助!!!

【问题讨论】:

  • 您的问题是一个错字:它是“maxent”(最大熵),而不是“maxtent”。
  • [nltk_data] 加载 maxent 时出错:在索引 False 中找不到包“maxent”
  • @alvas 这是一个关于拼写错误的问题,而不是关于如何使用标记器的重复问题。

标签: python nltk


【解决方案1】:

我发现我输入了一个错字

它的 nltk.download(maxent_treebank_pos_tagger)

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2016-06-01
    • 2012-04-21
    • 2017-07-30
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2012-01-21
    • 1970-01-01
    相关资源
    最近更新 更多