【问题标题】:Import wikipedia from sift.corpora从 sift.corpora 导入维基百科
【发布时间】:2019-04-18 22:58:28
【问题描述】:

我是 spark 新手,无法从 sift.corpora 导入 wikipedia 包。 我收到这个错误。 “ ImportError:没有名为“sift.corpora”的模块。这是我正在处理的笔记本。感谢您的帮助!

https://github.com/wikilinks/sift/blob/master/sift.ipynb

【问题讨论】:

    标签: python apache-spark pyspark sift


    【解决方案1】:

    首先,这是一个 python 问题,而不是 spark 问题。错误消息告诉您它找不到要导入的模块。 siftdocumentation 告诉你必须先安装 python 包才能使用它:

    pip install git+http://git@github.com/wikilinks/sift.git
    

    您必须在每个 spark 节点上执行此命令,因为 spark 是一个分布式环境。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2011-11-16
      • 2012-09-01
      • 2018-01-02
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2019-05-24
      • 1970-01-01
      相关资源
      最近更新 更多