【发布时间】:2021-03-27 05:26:00
【问题描述】:
我需要将来自 DynamoDB 的数据汇总到 AWS Redshift,并且我需要准确且同步。对于 ETL,我计划将 DynamoDB Streams、Lambda 转换、Kinesis Firehorse 用于最后的 Redshift。
更新数据的流程如何?我发现这一切都针对 ETL 进行了微调。哪个应该是保持(Dynamo 和 Redshift)同步的最佳选择?
这些是我目前的选择:
- 直接从 Lambda 触发“更新”命令到 Redshift(阻塞)。
- 汇总所有更新/删除记录并“以某种方式”每小时处理一次。
有这方面的经验吗?也许 Redshift 不是最好的解决方案?我需要提取汇总数据,以便对 2 TB 数据进行报告/仪表板。
【问题讨论】:
标签: aws-lambda amazon-dynamodb amazon-redshift etl amazon-kinesis-firehose