【问题标题】:AWS Random unhealthy instancesAWS 随机不健康实例
【发布时间】:2019-05-23 03:14:02
【问题描述】:

我的目标群体拥有大约 3-4 台服务器

从本周开始,我们开始看到间歇性的不健康警报

尽管它主要只用于 1 个实例并且非常短(1-2 分钟) 知道为什么会这样吗?我应该从哪里开始检查有什么问题?我可以确认我的应用在发生不健康事件时没有崩溃

【问题讨论】:

  • 在特定时间实例本身的所有日志中都没有任何内容?
  • 你指定了什么健康检查?

标签: amazon-web-services amazon-ec2 health-monitoring


【解决方案1】:

指标只是表明健康检查失败。

您可以配置健康检查:

  • 多久检查一次
  • 多少次失败会导致“不健康”
  • 多少次失败应该导致“健康”(失败后)

如果您发现实例即使被标记为不健康也能正常工作,那么您可能希望增加检查之间的时间,或增加将实例标记为不健康所需的检查次数。

但是,您确实应该首先调查应用程序是否正确响应以及可能导致运行状况检查失败的原因。您可以为>0 Unhealthy instances 设置警报,以通知您何时进行调查。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2016-10-28
    • 2016-02-16
    • 1970-01-01
    • 2021-05-22
    • 2021-06-30
    • 2018-10-10
    • 2021-11-17
    相关资源
    最近更新 更多