【问题标题】:AWS cloudwatch metricsAWS 云观察指标
【发布时间】:2018-09-19 22:24:02
【问题描述】:
我想了解更多详细信息以及对 aws Cloud watch 指标的影响 - aws 文档确实有很多关于指标的详细信息
以下指标有什么区别?
如果触发以下警报,对应用程序或 aws 实例有什么影响?
- 最近 5 分钟内的 Http 服务器错误大于 0(计数)已激活
- 过去 5 分钟内的请求数大于 100(计数)
- Http 404 GreaterThan 0 (Count) in the last 5 minutes' 已激活
- 在过去 5 分钟内的请求大于 500(计数)'已激活
Cloudwatch 在日志中检查这些错误?
【问题讨论】:
标签:
amazon-web-services
amazon-ec2
amazon-cloudwatch
amazon-cloudwatchlogs
amazon-cloudwatch-metrics
【解决方案1】:
这些指标与您的负载均衡器相关。这是我的解释:
- 负载平衡器后面的 Web 服务器抛出 HTTP 错误,代码为 5XX - 表明您的服务器无法执行请求。这可能是由于多种原因造成的,例如
Internal Server Error、Not Implemented(例如,服务器需要 POST 但客户端发送 GET)、Gateway Timeout(例如,服务器执行缓慢的数据库查询和
结果没有及时返回)等。
- 完成的请求数或建立的连接数超过 100 - 确切地表明了内容。
- 客户端收到的“未找到”消息的数量 - 表明客户端正在请求您的应用程序中不存在的页面(例如,https://stackoverflow.com/test)
- 完成的请求数或建立的连接数超过 500 - 与数字 2 相同,但表示请求数更多。
如果同时触发所有这些警报,则您的服务器可能负载很高,并且无法以最佳状态运行。然而,更多的是很难说。您需要检查最大错误数。最重要的是 5XX(数字 1)。
负载均衡器将这些指标发布到 CloudWatch,这些与您的应用程序日志没有任何关系(如果我理解正确的话)。