【问题标题】:Pyspark ImportError: No module named spark_df_profilingPyspark ImportError:没有名为 spark_df_profiling 的模块
【发布时间】:2019-07-31 01:21:14
【问题描述】:

我正在尝试在 pyspark databricks 环境中使用spark_df_profiling。我收到以下错误。

> pip install spark_df_profiling
from datetime import datetime
import spark_df_profiling
df = sql("select * from ab.data").cache()
ImportError: No module named 'spark_df_profiling'
---------------------------------------------------------------------------
ImportError                               Traceback (most recent call last)
<command-2036534138125494> in <module>()
      1 from datetime import datetime
----> 2 import spark_df_profiling

我该如何解决这个问题?

【问题讨论】:

  • 你是在集群环境还是独立环境中运行?

标签: python pyspark azure-databricks


【解决方案1】:

对于 Databricks,最好使用dbutils.library.installPyPI 方法安装包。

dbutils.library.installPyPI("spark_df_profiling")

import spark_df_profiling

【讨论】:

    猜你喜欢
    • 2020-09-22
    • 2013-03-11
    • 1970-01-01
    • 2012-12-07
    • 2012-05-23
    • 2019-07-29
    • 2015-07-04
    • 2014-03-15
    • 2017-12-29
    相关资源
    最近更新 更多