【发布时间】:2021-04-07 09:12:22
【问题描述】:
我想查询 AWS 负载均衡器日志以自动按计划为我发送报告。
我正在使用 Amazon Athena 和 AWS Lambda 来触发 Athena。我在这里根据指南创建了数据表:https://docs.aws.amazon.com/athena/latest/ug/application-load-balancer-logs.html
但是,我遇到以下问题:
- 日志存储桶的大小每天都在增加。我注意到如果 Athena 查询需要超过 5 分钟才能返回结果,有时会产生“未知错误”
- 因为 AWS Lambda 函数的最大超时时间仅为 15 分钟。因此,我不能继续增加 Lambda 函数超时等待 Athena 返回结果(例如,如果 Athena 需要 >15 分钟才能返回结果)
你们能为我推荐一些更好的解决方案来解决我的问题吗?我正在考虑使用 ELK 堆栈,但我没有使用 ELK 的经验,你能告诉我 ELK 与组合:AWS Lambda + AWS Athena 相比的优缺点吗?谢谢!
【问题讨论】:
-
看来你正在处理大数据问题,所以必须使用工具。也许 AWS EMR 会有所帮助?
-
您需要在整个日志历史记录中运行查询,还是仅针对过去几天/几周运行查询?
-
@Parsifal 目前,我按年运行。我认为上个月/几周也可以。但是,我创建了类似于指南中的步骤的表格,我在帖子中引用了链接。而且我认为如果我设置 s3 位置就像 /region/year/month 一样。比如第3个月的数据要倒进我的数据表中,到了第4个月的时候,表数据就会不正确。我必须重新创建我的数据表吗?你对我有什么建议吗?
标签: amazon-web-services amazon-athena