【问题标题】:kubeflow deploy gcp endpoints controller failskubeflow 部署 gcp 端点控制器失败
【发布时间】:2022-02-04 04:19:56
【问题描述】:

我正在尝试使用官方指南 https://www.kubeflow.org/docs/distributions/gke/deploy/deploy-cli/ 在 gcp 上部署 kubeflow

我尝试了 3 次,但似乎端点控制器有问题。检查时:kubectl -n kubeflow get all

所有 pod 都在运行,除了

    NAME                                                             READY   STATUS             RESTARTS   AGE
pod/admission-webhook-deployment-667bd68d94                1/1     Running            
pod/cache-deployer-deployment-75ccdc98b4                   2/2     Running            
pod/cache-server-56f78bf64b                                2/2     Running            
pod/centraldashboard-5fdbd9b744                            1/1     Running            
pod/cloud-endpoints-controller-5f7dbc6fc8                  0/1     ImagePullBackOff

Pod 描述说它无法解析引用“gcr.io/cloud-solutions-group/cloud-endpoints-controller:0.2.1”:意外状态代码 [manifests 0.2.1]:403 Forbidden

我是 kubeflow 的新手,但尽管重试了 3 次,但总是会导致同样的问题。

【问题讨论】:

  • 您应该可以浏览https://gcr.io/cloud-solutions-group/cloud-endpoints-controller:0.2.1,但该图像似乎不存在。这是一个问题。
  • 你用的是哪个版本的 Kubernetes?
  • v1.4.0,但我认为它也会影响其他版本

标签: google-cloud-platform kubeflow


【解决方案1】:

您可以克隆存储库并自己构建映像并将其推送到您的容器注册表。 这是在官方图像恢复之前解决此问题的一种解决方法。

git clone https://github.com/jlewi/cloud-endpoints-controller.git
cd cloud-endpoints-controller
git checkout 0.2.1
docker build . -t <YOUR DOCKER REGISTRY>/cloud-endpoints-controller:0.2.1
docker push <YOUR DOCKER REGISTRY>/cloud-endpoints-controller:0.2.1

这将使用您的 pod 规范中的新图像。

【讨论】:

    【解决方案2】:

    紧急发布:https://github.com/kubeflow/gcp-blueprints/releases/tag/v1.4.1,您现在可以使用 v1.4.1 标签进行部署。

    ----原创-----

    感谢您发布此问题!我在https://github.com/kubeflow/gcp-blueprints/issues/343#issuecomment-1028488756 中发布了缓解解决方案。我计划在即将发布的版本中解决此问题。

    【讨论】:

      猜你喜欢
      • 2020-07-06
      • 2022-09-01
      • 2021-10-05
      • 2020-03-21
      • 2021-08-20
      • 2019-03-12
      • 2019-01-04
      • 2021-12-21
      • 1970-01-01
      相关资源
      最近更新 更多