【发布时间】:2019-12-06 14:52:17
【问题描述】:
我正在 Kubernetes 上运行 Argo 工作流程。
在我关注this blog 设置 Jupyterhub 之后,我开始在 Argo 上的 pod 上收到此错误(在使用 Jupyterhub 之前从未遇到过问题):
failed to save outputs: timed out waiting for the condition。
如果我添加,作业总是失败
resources:
limits:
nvidia.com/gpu: 1
但是如果不使用gpu,它有时会成功(偶尔失败后使用retryStrategy)。
有人可以帮我吗?
【问题讨论】:
-
什么是 Argo 版本?
-
argo版本为v2.3.0
-
可以粘贴工作流控制器的日志吗?
kubectl logs -n argo workflow-controller-XXXX -
@A_Suh 谢谢,是的,它失败并出现同样的错误。我增加了 activeDeadlineSeconds 但它没有改变任何东西。似乎第一步无法访问或保存 /tmp/ 目录中的工件以跨步骤共享工件。
-
你找到解决这个问题的方法了吗?
标签: kubernetes amazon-eks argo-workflows