【发布时间】:2021-09-07 13:31:44
【问题描述】:
从提供的 dataprocs 文档中可以看出:
为避免因非活动集群产生 Google Cloud 费用, 当您创建一个 簇。此功能提供删除集群的选项:
- 在指定的集群空闲期之后
- 在指定的未来时间
- 从提交集群创建请求开始的指定时间段后
但是,我正在寻找的是允许我自动安排集群活动的东西,例如我希望集群仅在工作日和工作时间处于活动状态。
这样我就可以避免产生额外的成本,而无需手动停止(或者更确切地说,只需像从 DataProc 文档中看到的那样删除)并每天重新创建集群。
为此,在 Compute Engine 中,我可以为集群的虚拟机创建调度以停止它们。
虽然,通过使用这种方法,虚拟机通过这个计划停止,但我仍然看到集群在 DataProc 中“运行”。
我是否仍然需要承担费用?如果是,在 DataProc 中是否有任何类似的计划替代方案?
作为附加问题,是否可以将计划应用于具有自动缩放策略的集群?
【问题讨论】:
-
您应该考虑为什么要挂在集群上而不是重新创建它。停止的集群不是免费的,因为它是为磁盘收费的。此外,静态集群没有获得任何上游(spark、hadoop)错误修复、安全更新,甚至是关键操作系统补丁(如CVE-2018-3590)。
标签: google-cloud-platform google-compute-engine google-cloud-dataproc