【发布时间】:2021-03-01 13:29:16
【问题描述】:
我正在尝试将 DynamoDB 表以 JSON 格式导出到 S3,然后从那里将其导入 BigQuery。重要的部分是将 DynamoDB 表作为 JSON 格式导出到 S3,因为我正在处理的表不是一个小表。该表包含 560 万条记录,每天插入大约 15.000 条(在平静的日子)新记录。我遇到了一篇博客文章,其中建议使用 Lambda(参考:http://randomwits.com/blog/export-dynamodb-s3)函数,但 table.scan() 函数不适用于大型表。
那么,如何将 JSON 格式的 DynamoDB 表导出到 S3 并从那里有效地将其导入 BigQuery?我看到了一些选项,例如 HEVO、Glue 等。但我不知道哪种方式最有效。
【问题讨论】:
-
DynamoDB 有一个新功能“导出到 S3”,它提供了一个很好的解决方案,但在这种情况下,我必须为 Amazon DynamoDB 启用时间点恢复 (PITR)。我不确定它是否值得,解决方案是否有效。
-
@M.EceErcan 请通过以下链接。 aws.amazon.com/blogs/aws/…
标签: amazon-web-services amazon-s3 aws-lambda amazon-dynamodb