【问题标题】:How can I copy data from amazon S3 to redshift automatically?如何自动将数据从 amazon S3 复制到 redshift?
【发布时间】:2016-09-25 14:59:35
【问题描述】:

首先我想告诉你我现在是如何应对的。

我正在手动将数据从 S3 处理到 redshift,即在 SQL Workbench 中使用复制命令。有时我通过 JDBC 选项执行此命令。

我认为这不是复制数据的正确选择。复制可能有一个很好的解决方案。当新数据进入 S3 时,我想自动复制数据。任何解决方案将不胜感激。

谢谢。

【问题讨论】:

    标签: java amazon-web-services amazon-s3 amazon-redshift


    【解决方案1】:

    我会使用 lambda。

    1. 您可以在将新对象插入 S3 时触发 lamdba (see doc)

    2. 根据您必须从 S3 复制的数据量,最好聚合工作以加快工作速度

    AWS 已经发布了code from labs,它将数据从 S3 存储桶加载到 redshift。

    This blog from amazon 从 github 项目中提取了很多文档,看看如何将其付诸实践。

    【讨论】:

    • 这比我回复我的答案更有效。 :)
    • 如果可以的话,您能否分享一下python中的代码,虽然我在您的github中的javascript中找到了它,但想在python中实现。提前致谢。
    【解决方案2】:

    Lambda 方法看起来相当不错,而且很受欢迎。作为替代方案,还可以考虑 AWS Glue。配置起来不是很简单,但它似乎是为处理这种工作流程而设计的。

    【讨论】:

      猜你喜欢
      • 2018-09-12
      • 2021-08-16
      • 1970-01-01
      • 2013-03-20
      • 1970-01-01
      • 1970-01-01
      • 2019-04-23
      • 2020-12-28
      • 2013-05-07
      相关资源
      最近更新 更多