Kubernetes 作业是否有“最大重试次数”？答案

【问题标题】：Is there a 'max-retries' for Kubernetes Jobs?Kubernetes 作业是否有“最大重试次数”？
【发布时间】：2016-05-10 13:23:24
【问题描述】：

我有想要在 Kubernetes 上运行的批处理作业。我对乔布斯的理解：

如果我选择restartPolicy: Never，这意味着如果 Job 失败，它将销毁 Pod 并重新调度到（可能）另一个节点。如果是restartPolicy: OnFailure，则会重启现有Pod中的容器。我认为一定数量的故障是不可恢复的。有没有办法可以防止它在一段时间后重新安排或重新启动并清理不可恢复的作业？

我目前的解决方法是设置一些看门狗进程来查看 retryTimes 并在指定重试次数后清理作业。

【问题讨论】：

标签： google-compute-engine kubernetes

【解决方案1】：

闲散讨论总结：

不，没有重试限制。但是，您可以使用 activeDeadlineSeconds 设置从 v1.2 开始的作业的截止日期。系统应停止重新启动，然后在作业到达最后期限时终止作业。

【讨论】：

【解决方案2】：

仅供参考，现在已添加为.spec.backoffLimit。

https://kubernetes.io/docs/concepts/workloads/controllers/jobs-run-to-completion/

【讨论】：