【发布时间】:2019-01-27 00:12:38
【问题描述】:
我正在尝试创建系统健康检查。我希望能够确定 Pod 重启的频率。由于 pod 有 liveness probes,如果出现问题,它们可能会不断重启。是否有办法检查 pod 的重启时间,而不仅仅是重启次数和 pod 存活的总时间?
【问题讨论】:
-
您是否已经在集群上运行 Prometheus(或类似的指标收集系统)?
-
另外,虽然不是完全您问题的答案,
kubectl get --all-namespaces=true events --watch将创建您系统中所有 Pod 事件的运行列表,其中肯定包括 Pod 创建和破坏。我完全希望您可以像kubectl那样订阅该列表 -
@Matthew 感谢您的回复。我不相信我们有 prometheus(如果有,我们不会使用它)我运行了“find / -iname 'prometheus'',但没有找到任何 prometheus 文件。我目前没有可用的部署,您提到的命令是否会提供所有 pod 的所有事件(它会显示 pod A 在时间 x 开始在时间 y 失败并在时间 z 重新开始,或者只是当前生活的事件豆荚)
-
您提到的命令是否会为所有 pod 提供所有事件,是的,这就是
--watch所做的:通知 k8s 您希望了解未来的变化到那个资源,也
标签: kubernetes kubernetes-health-check