【发布时间】:2017-11-21 14:51:57
【问题描述】:
我有一个 Linux 标准 B2ms 天蓝色虚拟机。我已禁用您在操作面板中看到的自动关机功能。由于某种原因,该服务器在运行大约 8 天后仍然关闭。
如果我在过去三天内没有更改任何内容,有什么原因可能会关闭此服务器?
【问题讨论】:
标签: azure azure-virtual-machine
我有一个 Linux 标准 B2ms 天蓝色虚拟机。我已禁用您在操作面板中看到的自动关机功能。由于某种原因,该服务器在运行大约 8 天后仍然关闭。
如果我在过去三天内没有更改任何内容,有什么原因可能会关闭此服务器?
【问题讨论】:
标签: azure azure-virtual-machine
如果我没有关闭服务器,有什么原因可以关闭 过去三天有什么变化吗?
关闭这个虚拟机的原因有很多,也许我们应该试着找到一些关于这个的日志。
首先,我们应该通过 Azure 门户检查 Azure Alerts,尝试找到一些关于你的 VM 的日志。
其次,我们应该检查这个VM的性能,可能是CPU使用率高或内存使用率高,我们可以在/var/log/*找到日志。
我们也可以尝试查找 Azure 服务是否存在问题,我们可以查看service Health -> Health history 查找您所在地区是否存在问题。
顺便说一句,如果我们只是在 Azure 中创建一个 VM,我们无法避免单点故障。在 Azure 中,微软建议两个或更多在可用性集中创建 VM 以提供高可用性应用程序并满足 99.95% 的 Azure SLA。
可用性集由两个额外的组组成,它们可以防止硬件故障并允许安全地应用更新 - 故障域 (FD)和更新域(UD)。
故障域:
故障域是一组逻辑底层硬件,它们共享一个公共电源和网络交换机,类似于本地数据中心内的机架。当您在可用性集中创建 VM 时,Azure 平台会自动将您的 VM 分布在这些容错域中。这种方法可以限制潜在的物理硬件故障、网络中断或电源中断的影响。
更新域:
更新域是一组可以同时进行维护或重新启动的底层硬件的逻辑组。当您在可用性集中创建 VM 时,Azure 平台会自动在这些更新域中分发您的 VM。这种方法可确保在 Azure 平台进行定期维护时,至少有一个应用程序实例始终保持运行。在计划维护期间,更新域的重启顺序可能不会按顺序进行,但一次只能重启一个更新域。
在您的场景中,可能有一些计划外的维护事件,当微软更新虚拟机主机时,他们会将您的虚拟机迁移到另一台主机,他们会关闭您的虚拟机然后迁移它。
为了实现高可用性,也许我们应该在一个可用性集中创建至少两个 VM。
【讨论】: