【发布时间】:2020-11-17 18:26:40
【问题描述】:
我正在寻找一个包,或者以前使用 redshift 作为结构化流数据帧源的实现。
spark.readStream \
.format("io.github.spark_redshift_community.spark.redshift") \
.option('url', redshift_url) \
.option('forward_spark_s3_credentials', 'true') \
.load()
使用下面的格式会在读取时出错。如:
Data source io.github.spark_redshift_community.spark.redshift does not support streamed reading
如果您从 Spark 3 降级并使用:com.databricks.spark.redshift,则会出现同样的错误
是否有已知的解决方法或方法/模式我可以用来实现(在 pyspark 中)redshift 作为 readStream 数据源
【问题讨论】:
标签: apache-spark amazon-redshift spark-structured-streaming