【发布时间】:2016-10-28 02:16:33
【问题描述】:
我们可以使用以下方式下载所有 nltk 数据:
> import nltk
> nltk.download('all')
或使用特定数据:
> nltk.download('punkt')
> nltk.download('maxent_treebank_pos_tagger')
但我想下载除“corpara”文件之外的所有数据, 例如 - 所有分块器、语法器、模型、词干分析器、标记器、标记器等
在没有下载器 UI 的情况下有什么方法可以做到这一点?比如,
> nltk.download('all-taggers')
【问题讨论】:
-
我想我在某个时候调查过这个问题,但找不到办法。源代码是here,物有所值。
标签: python nlp nltk corpus nltk-trainer