【发布时间】:2020-12-04 09:35:52
【问题描述】:
Delta jardelta-core_2.11-0.6.1.jar 被添加到 EMR Master 节点“SPARK_HOME/jars”目录中。但是从 EMR Notebook 调用 Delta API 我收到以下错误:
# Though Notebook comes with default SPARK instant so following line I didn't execute
# spark = SparkSession.builder.appName("MyApp") \
# .config("spark.jars.packages", "io.delta:delta-core_2.11:0.6.1") \
# .getOrCreate()
from delta.tables import * # ModuleNotFoundError: No module named 'delta'
CLI 命令pyspark --packages "io.delta:delta-core_2.11:0.6.1" 在主节点中运行良好。我可以在 CLI 模式下访问 Delta API。
有什么方法可以直接在 Notebook 中使用 Delta API。请提出建议。
【问题讨论】:
-
一种方式
python sc = spark.sparkContext sc.addPyFile(/usr/lib/spark/jars/delta-core_2.11-0.6.1.jar") from delta.tables import * # working fine now
标签: python amazon-web-services pyspark amazon-emr delta-lake