【发布时间】:2017-01-17 22:37:08
【问题描述】:
EMR Spark集群和redshift之间的读/写操作绝对可以通过。 intermediary data dump 到 s3。
不过有 spark 库,可以直接将 redshift 当作数据源:https://github.com/databricks/spark-redshift
EMR 5.0 Spark 集群是否预配置了用于 redshift 访问的库和访问凭证?
【问题讨论】:
-
查看更新的答案。我昨天刚刚完成了所有这些工作,并决定重写我的答案以更具体。
标签: amazon-web-services apache-spark amazon-redshift emr