【问题标题】:How to import Delta Lake module in Zeppelin notebook and pyspark?如何在 Zeppelin notebook 和 pyspark 中导入 Delta Lake 模块?
【发布时间】:2020-03-28 22:27:22
【问题描述】:

我正在尝试在带有 pyspark 的 Zeppelin 笔记本中使用 Delta Lake,但它似乎无法成功导入模块。例如

%pyspark
from delta.tables import *

它失败并出现以下错误:

ModuleNotFoundError: 没有名为“delta”的模块

但是,使用delta 格式保存/读取数据帧没有问题。使用scala spark%spark可以成功加载模块

有没有办法在 Zeppelin 和 pyspark 中使用 Delta Lake?

【问题讨论】:

    标签: pyspark apache-zeppelin delta-lake


    【解决方案1】:

    终于设法将它加载到 zeppelin pyspark 上。必须明确包含 jar 文件

    %pyspark
    sc.addPyFile("**LOCATION_OF_DELTA_LAKE_JAR_FILE**")
    from delta.tables import *
    

    【讨论】:

      猜你喜欢
      • 2020-10-01
      • 2021-12-22
      • 1970-01-01
      • 1970-01-01
      • 2021-05-12
      • 2021-02-01
      • 1970-01-01
      • 2020-02-21
      相关资源
      最近更新 更多