Heroku Django 应用程序使用 NLTK：如何在应用程序中使用 NLTK 语料库？答案

【问题标题】：Heroku Django app using NLTK: How do I use the NLTK corpora in the app?Heroku Django 应用程序使用 NLTK：如何在应用程序中使用 NLTK 语料库？
【发布时间】：2015-09-23 18:12:08
【问题描述】：

我正在将 python NLTK 用于 Django 应用程序。在本地，我下载了 NLTK 语料库，一切正常。对于heroku，我尝试将语料库放到文件系统上并推送到heroku（如此处所述：LookupError: Resource 'corpora/stopwords' not found），但这超出了heroku 的1GB 限制。

现在我已将语料库添加到 AWS S3 存储桶，但不知道如何将 nltk 数据导入 django 应用程序。我该怎么做？谢谢！

【问题讨论】：

devcenter.heroku.com/articles/python-nltk

标签： python django heroku amazon-s3 nltk

【解决方案1】：

这样做的方法是将 S3 存储桶公开，然后使用相应的 url 来获取所需的对象。

例如：

pos_tagger = nltk.data.load("http://<your S3 bucket with the nltk data>.s3.amazonaws.com/nltk_data/taggers/maxent_treebank_pos_tagger/english.pickle")

【讨论】：