【发布时间】:2019-03-15 22:30:56
【问题描述】:
集群禁用了自动升级。今天早上(2018 年 10 月 10 日,太平洋标准时间上午 10:00 左右),几乎所有的 pod 都重新启动了。 有没有可能与 K8s 或 GKE 新版本发布有关? 如果不是,重启的原因是什么?
【问题讨论】:
标签: kubernetes google-kubernetes-engine
集群禁用了自动升级。今天早上(2018 年 10 月 10 日,太平洋标准时间上午 10:00 左右),几乎所有的 pod 都重新启动了。 有没有可能与 K8s 或 GKE 新版本发布有关? 如果不是,重启的原因是什么?
【问题讨论】:
标签: kubernetes google-kubernetes-engine
【讨论】:
在不查看 pod 事件和其他日志的情况下,通过假设节点也重新启动,我可以推测对运行节点的数据中心的物理元素进行了紧急维护操作。这可以从操作历史记录和 Stackdriver 日志等中确认。
另外,查找导致 pod 重启的节点耗尽资源(OOM 杀手)。
【讨论】: