【发布时间】:2019-07-31 01:21:14
【问题描述】:
我正在尝试在 pyspark databricks 环境中使用spark_df_profiling。我收到以下错误。
> pip install spark_df_profiling
from datetime import datetime
import spark_df_profiling
df = sql("select * from ab.data").cache()
ImportError: No module named 'spark_df_profiling'
---------------------------------------------------------------------------
ImportError Traceback (most recent call last)
<command-2036534138125494> in <module>()
1 from datetime import datetime
----> 2 import spark_df_profiling
我该如何解决这个问题?
【问题讨论】:
-
你是在集群环境还是独立环境中运行?
标签: python pyspark azure-databricks