【发布时间】:2020-11-10 16:15:40
【问题描述】:
我正在使用 AWS EMR 计算集群(版本 5.27.0),它使用 S3 进行数据持久性。 该集群对 S3 进行读写操作。
S3存在eventual consistency的问题,导致写入数据后无法立即列出。因此,我使用 EMRFS 和 DynamoDB 来存储新写入的路径以便立即列出。
现在的问题是我必须在 S3 上设置保留策略,因为超过一个月的数据将从 S3 中删除。但是,这样做不会从 EMRFS DynamoDB 表中删除数据,从而导致一致性问题。
我的问题是,如何确保在 S3 中设置保留策略时,从 DynamoDB 表中删除相同的路径?
我想出的一个简单的解决方案是定义一个 Lambda,它会定期触发,并在 DynamoDB 记录上手动设置 1 天的 TTL。还有比这更好的方法吗?
【问题讨论】:
标签: amazon-s3 amazon-dynamodb amazon-emr