【问题标题】:How to detect a kernel panic on a remote machine?如何检测远程机器上的内核恐慌?
【发布时间】:2013-06-03 21:39:18
【问题描述】:

我有软件可以监控本地网络上多台 linux 机器的运行状况。它所做的一项检查是定期 ping 所有机器以确保它们能够响应。

我最近注意到一台或多台机器可能处于内核恐慌状态但仍响应 ping。我想知道是否可以在 C++ 中进行某种检查,在以下任一情况下返回 true:

a) 远程机器无响应(当前使用 ping 语句执行此操作)。 b) 远程机器有响应,但处于内核恐慌状态。

问题是,我不知道在内核恐慌期间什么有效,什么无效。

如果有帮助,这在 RHEL 5.7 上。提前致谢!

【问题讨论】:

    标签: c++ linux kernel rhel panic


    【解决方案1】:

    答案是:视情况而定。有时内核恐慌甚至会停止 ping 响应。 “无响应”的定义将取决于机器的用例。如果有办法确定机器的主要用途仍然可以在本地实现,您可以使用 SNMP 和/或 Web(或其他一些网络协议)来确保它响应。

    一种常见的监控方法(有很多针对各种向量和服务的预制插件)是使用 nagios、icinga 或类似的工具。

    【讨论】:

    • 谢谢。我们实际上做了一些 SNMP/MIB 查询来确定机器及其硬件的状态。据报道,即使在内核恐慌期间,该软件仍能恢复健康状态。 SNMP 通讯是否可以在紧急情况下工作?现在,我建议我们在内核崩溃时启用自动重启。
    猜你喜欢
    • 1970-01-01
    • 2016-08-29
    • 1970-01-01
    • 2013-12-12
    • 1970-01-01
    • 2020-01-28
    • 2022-11-10
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多