【发布时间】:2020-11-05 07:24:26
【问题描述】:
我正在尝试使用 AWS 胶水作业访问 S3 上的 Delta 湖表,但出现“未定义模块 Delta”的错误
from pyspark.sql import SparkSession
from pyspark.conf import SparkConf
spark = SparkSession.builder.appName("MyApp").config("spark.jars.packages", "io.delta:delta-core_2.11:0.6.0").getOrCreate()
from delta.tables import *
data = spark.range(0, 5)
data.write.format("delta").save("S3://databricksblaze/data")
在胶水作业的依赖 jar 中也添加了必要的 Jar ( delta-core_2.11-0.6.0.jar )。 谁可以帮我这个事 谢谢
【问题讨论】:
标签: apache-spark aws-glue delta-lake