【发布时间】:2020-02-19 15:23:37
【问题描述】:
我有一个配置了 redis 和 maven 的服务器 然后我执行以下 sparkSession
spark = pyspark
.sql
.SparkSession
.builder
.master('local[4]')
.appName('try_one_core')
.config("spark.redis.host", "XX.XXX.XXX.XXX")
.config("spark.redis.port", "6379")
.config("spark.redis.auth", "XXXX")
.getOrCreate()
我正在尝试连接到远程 redis 服务器并从中写入/加载数据,但是当我尝试使用以下命令进行 .save() 时
df
.write
.format("org.apache.spark.sql.redis")
.option("table", "df")
.option("key.column", "case_id")
.save()
我收到以下错误:
py4j.protocol.Py4JJavaError: 调用时出错 o327.保存。 : java.lang.ClassNotFoundException: 找不到数据 来源:org.apache.spark.sql.redis。请在以下位置找到包裹 http://spark.apache.org/third-party-projects.html
有什么解决办法吗?
【问题讨论】:
标签: pyspark redis pyspark-sql pyspark-dataframes redis-server