【问题标题】:Unable to import org module to PySpark cluster无法将 org 模块导入 PySpark 集群
【发布时间】:2020-06-01 20:41:07
【问题描述】:

我正在尝试从 org 模块导入 FPGrowth,但在安装 org 模块时会引发错误。我也试过把 org.apache.spark 换成 pyspark,还是不行。

!pip install org
import org.apache.spark.ml.fpm.FPGrowth

以下是错误:

ERROR: Could not find a version that satisfies the requirement org (from versions: none)
ERROR: No matching distribution found for org
---------------------------------------------------------------------------
ModuleNotFoundError                       Traceback (most recent call last)
<ipython-input-12-c730562e7076> in <module>
      1 get_ipython().system('pip install org')
----> 2 import org.apache.spark.ml.fpm.FPGrowth

ModuleNotFoundError: No module named 'org'

【问题讨论】:

    标签: python apache-spark pyspark google-cloud-dataproc fpgrowth


    【解决方案1】:

    要在 PySpark 中导入 FPGrowth,您需要编写:

    from pyspark.ml.fpm import FPGrowth
    

    您可以在Spark documentation 中找到有关如何使用FPGrowth 的更多说明。

    【讨论】:

      猜你喜欢
      • 2017-07-04
      • 2019-05-12
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2016-12-14
      • 2021-08-03
      • 1970-01-01
      • 2021-08-22
      相关资源
      最近更新 更多