【问题标题】:Heroku Django app using NLTK: How do I use the NLTK corpora in the app?Heroku Django 应用程序使用 NLTK:如何在应用程序中使用 NLTK 语料库?
【发布时间】:2015-09-23 18:12:08
【问题描述】:

我正在将 python NLTK 用于 Django 应用程序。在本地,我下载了 NLTK 语料库,一切正常。对于heroku,我尝试将语料库放到文件系统上并推送到heroku(如此处所述:LookupError: Resource 'corpora/stopwords' not found),但这超出了heroku 的1GB 限制。

现在我已将语料库添加到 AWS S3 存储桶,但不知道如何将 nltk 数据导入 django 应用程序。我该怎么做?谢谢!

【问题讨论】:

标签: python django heroku amazon-s3 nltk


【解决方案1】:

这样做的方法是将 S3 存储桶公开,然后使用相应的 url 来获取所需的对象。

例如:

pos_tagger = nltk.data.load("http://<your S3 bucket with the nltk data>.s3.amazonaws.com/nltk_data/taggers/maxent_treebank_pos_tagger/english.pickle")

【讨论】:

    猜你喜欢
    • 2011-05-15
    • 2014-11-23
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2015-07-03
    • 2013-07-02
    相关资源
    最近更新 更多