【问题标题】:gcloud dataproc clusters update - How to remove a pending update that is preventing a successful command rungcloud dataproc clusters update - 如何删除阻止命令成功运行的挂起更新
【发布时间】:2019-07-16 23:00:53
【问题描述】:

在我的 google dataproc 集群中,我尝试通过停用一个数据节点来动态调整集群大小。使用工作人员数量执行集群更新,以将集群大小减少到 1 个主服务器和 5 个工作人员,但超过 2 小时未完成。

ERROR: (gcloud.dataproc.clusters.update) FAILED_PRECONDITION: Cannot update cluster 'my-cluster-dev' while it has other pending update operations.

我锁定了我的计算机并且不知何故丢失了命令外壳,因此集群仍然显示其处于更新状态,阻止我执行任何操作。我现在已经花了大约 5 个小时,仍然无法执行任何命令或访问集群。

gcloud dataproc clusters describe my-cluster-dev

projectId: my-project-id-dev
status:
  state: UPDATING
  stateStartTime: '2019-02-22T12:30:02.084Z'
statusHistory:

谁能帮我解决一下让我的集群陷入更新状态的进程,这样我就可以在集群上执行其他任务了吗?

【问题讨论】:

    标签: google-cloud-platform gcloud google-cloud-dataproc


    【解决方案1】:

    遇到了同样的问题。试图更新工人的数量并陷入“更新”状态。与 OP 一样,主节点的手动停止/启动解决了该问题。

    【讨论】:

    • 这是WAI。不支持并发更新。集群卡在“更新”状态,因为它试图优雅地停用您尝试删除的节点。重新启动 master 会有所帮助,因为它会中断正常停用并完成更新。
    【解决方案2】:

    您采取了哪些措施来减少集群中的节点数量?目前尚不清楚“通过停用一个数据节点来动态调整集群大小”是什么意思。您是说当 my-cluster-dev 有 6 个节点并且它陷入更新状态时运行“gcloud dataproc clusters update my-cluster-dev --num-masters=1 --num-workers=5”还是有任何您执行的其他操作?

    【讨论】:

    • 感谢您的回复,是的,我在没有主标志的情况下运行了“gcloud dataproc clusters update my-cluster-dev --num-workers=5”。我通过手动重启主节点让它脱离了更新状态。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2020-07-04
    • 1970-01-01
    • 2022-01-16
    • 2022-01-14
    • 1970-01-01
    • 2019-10-27
    • 2019-10-18
    相关资源
    最近更新 更多