【问题标题】:Not able to download nltk data for framenet_v15无法下载 framenet_v15 的 nltk 数据
【发布时间】:2014-01-13 16:39:37
【问题描述】:

我正在尝试下载nltk 的所有数据包。但是尝试下载framenet_v15时总是失败。它只是挂在那里。

在同一台机器上多次尝试。每次几乎离开30分钟,一次超过一个小时。尝试将源服务器替换为google svn,但下载器出错。

很遗憾,我没有任何其他信息。有没有办法弄清楚问题是什么?或者是否有其他来源可以下载nltk 数据?

谢谢。

编辑:

终于用wget -c下载了,经过多次重试才终于完成下载。

一些观察

  1. 在下载了一些数据后,连接将冻结。无法通过 ping 访问服务器。
  2. 可下载的数据在托管 nltk.org 的同一台服务器上共享。
  3. 当下载冻结时,该站点也不可用(不是 nltk.org),但其他站点未启用缓存。显然服务器无法服务。
  4. 可能存在资源泄漏,这在此下载中表现出来。
  5. 可能会重新启动进程,这会使服务器在一段时间(~2 分钟)后可用。
  6. 为什么大型下载不使用 torrent?只是另一种下载选项。

【问题讨论】:

  • 你离开它多久了?您是否尝试过多次或从另一台机器上尝试过?
  • 已将您询问的信息添加到问题中。
  • 可以添加你使用的命令吗?
  • 试试下面的链接。它对我有用。
  • 仍然下载失败,随机挂在特定大小。只是古玩,你在下载时有非常高速的连接吗?

标签: download nltk


【解决方案1】:

编辑:这是一个直接链接,可让您从 Frame Net 项目请求数据:https://framenet.icsi.berkeley.edu/fndrupal/framenet_request_data

当我下载 NLTK 数据时,我不得不多次运行下载器,因为它一直挂起。

或者,这里是单个文件的列表:http://nltk.org/nltk_data/

我刚刚从这个链接下载了framenet_v15:http://nltk.github.com/nltk_data/packages/corpora/framenet_v15.zip

另外,有关此问题的更多讨论,请参阅此问题:Installing natural language toolkit data

【讨论】:

  • 您提供的链接重定向到 nltk.org 页面。所以在某种程度上这不再是替代品了?你有任何替代来源,我可以从那里下载数据。
【解决方案2】:

我尝试下载

import nltk

nltk.download('all')

它对我有用

【讨论】:

    【解决方案3】:

    FWIW 我在使用 framenet v15 时遇到了同样的问题。重新启动 nltk.download() 并仅从语料库中自行下载 framenet 包似乎对我有用。完成之后,我就可以从收藏选项卡中完成所有其他内容的下载。

    【讨论】:

      【解决方案4】:

      假设您由于使用wget 而在 Unix 上,我建议为您想要的 NLTK 数据包创建一个包(即framenet)。

      我最近出于类似原因创建了nltk-data-punkt.spec,它可以作为其他数据包的示例。

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 1970-01-01
        • 2014-04-08
        • 2017-05-11
        • 1970-01-01
        • 2020-04-05
        • 2016-10-28
        • 1970-01-01
        • 2019-03-03
        相关资源
        最近更新 更多