【发布时间】:2017-01-25 08:43:15
【问题描述】:
我正在使用 DynamoDB 流和 Aws lambda 函数 + firehose 来将我的数据与 redshift 同步。我想知道是否可以将所有 DynamoDB 记录添加到流中以进行再处理。如果没有,正确的做法是什么?
【问题讨论】:
标签: amazon-dynamodb amazon-redshift aws-lambda amazon-dynamodb-streams
我正在使用 DynamoDB 流和 Aws lambda 函数 + firehose 来将我的数据与 redshift 同步。我想知道是否可以将所有 DynamoDB 记录添加到流中以进行再处理。如果没有,正确的做法是什么?
【问题讨论】:
标签: amazon-dynamodb amazon-redshift aws-lambda amazon-dynamodb-streams
对于新数据,您可以这样做。 对于历史数据,最好不要这样做。您可以先转储表,然后再导入。
【讨论】:
对于重新处理旧数据,并行全表扫描是可行的方法。有一个问题是决定如何处理从“旧数据”到“新数据”的转换,但这可以通过使用时间戳属性(如果可用)或通过停止对表的写入来实现。
【讨论】: