【问题标题】:GCE instance stopped working for 1 hourGCE 实例停止工作 1 小时
【发布时间】:2018-08-25 06:17:18
【问题描述】:

我有一个 GCE VM 实例在过去 3 个月内两次离线大约一个小时。在这两种情况下,它都会自行恢复。我想知道如何找出问题所在,以免再次发生。

  • 在这一小时内,无法通过 SSH 访问实例,网站已关闭。

  • 我在网上查了一下:

    1. 有些人建议磁盘空间可能已满,而我的情况并非如此。
    2. 有人建议查看实例日志,没有任何异常。
  • 我知道我的问题含糊不清,但是我需要帮助才能开始寻找错误的根源。本质上,我不知道我在寻找什么以及我应该在哪里寻找。非常感谢任何帮助。

【问题讨论】:

  • 发生这种情况时,您能否查看实例的串口日志? (不确定这是否是您所说的“实例日志”。)

标签: google-compute-engine


【解决方案1】:

您的虚拟机是否使用本地 SSD?

来自https://cloud.google.com/compute/docs/disks/local-ssd#data_persistence

“如果主机系统遇到主机错误,Compute Engine 会尝试保留本地 SSD 数据,但只有在底层驱动器在 60 分钟内恢复时才能这样做。”

尝试恢复数据可以解释您的停机时间。

【讨论】:

  • Kevan 感谢您的评论,但是,我没有本地 SSD。还有其他想法吗?
【解决方案2】:

时间是否与https://status.cloud.google.com/summary 中列出的任何 Google Compute Engine 或 Google Cloud Networking 事件匹配?如果是这样,您可能受到了中断的影响。

【讨论】:

  • 大卫,感谢您的回答。是的,我已经查过了,当时没有任何事件发生。
猜你喜欢
  • 1970-01-01
  • 2021-02-06
  • 2017-05-07
  • 1970-01-01
  • 2011-06-17
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多