【发布时间】:2018-05-23 06:10:24
【问题描述】:
我们通过 Kinesis Firehose 将应用程序日志发送到 S3。我们希望这些数据也流向 DynamoDB,以便我们可以有效地查询要在 Web UI(Ember 应用程序)中呈现的数据。这样做是为了让用户能够对数据进行过滤和排序等。基本上是为了支持通过 Web UI 进行查询的能力。
我查看了 AWS 数据管道。这是可靠的,但更适合一次性导入或预定导入。我们希望从 s3 到 dynamoDB 的数据流是连续的。
还有哪些其他选择可以实现这一目标?将数据从 S3 移动到 dynamoDB 并不是一个非常独特的要求。那你是怎么解决这个问题的?
S3 事件触发 lambda 是一个选项吗?如果是,那么如何让这个 lambda 容错?
【问题讨论】:
-
您尝试过 AWS Athena 吗?它允许您对 S3 数据执行类似 SQL 的查询。
-
@dashmug 是的。这是我们的第一选择。我们在 s3 中对数据进行了分区,并在其上使用了 Athena。使用 Athena 的成功(在规模、成本方面)取决于分区策略。在我们的用例中,我们估计会达到分区的限制,因此不可行/不划算。
标签: amazon-s3 aws-lambda amazon-dynamodb amazon-kinesis-firehose