【发布时间】:2017-08-27 15:41:49
【问题描述】:
我想使用 AWS AccessLogs 使用现有面向批处理的 ETL 管道来处理网站印象,该管道可以抓取最后一小时的印象并对其进行大量进一步的转换。
AccessLog 的问题在于:
但是请注意,一段时间内的部分或全部日志文件条目可以 有时最多延迟 24 小时
所以我永远不会知道特定小时的所有日志何时完成。 不幸的是,我不能使用任何流式解决方案,我需要使用现有的管道来抓取每小时批次的数据。
所以我的问题是,有什么方法可以通知 所有 日志已在特定小时内传送到 s3?
【问题讨论】:
-
您指的是 Amazon S3 Server Access Logging 还是 Amazon CloudFront Access Logs?
-
@JohnRotenstein 抱歉,我说的是 CloudFront AccessLogs 存储到 s3,然后由我在 ETL 管道中处理。
标签: amazon-web-services amazon-s3 amazon-cloudfront access-log