【发布时间】:2020-11-24 15:14:38
【问题描述】:
这是一个纯粹的理论问题。一个标准的 Kubernetes 集群提供了自动缩放。如果内存超过某个 targetMemUtilizationPercentage,那么就会启动一个新的 pod,它会处理到达所包含服务的请求流。 minReplicas 的数量设置为 1,maxReplicas 的数量设置为 5。
当在线的 pod 数量达到最大值(在我们的例子中是 5 个)并且来自客户端的请求仍然向节点发送时会发生什么?这些请求是否被缓存在某个地方被丢弃了?我可以采取任何措施来避免请求丢失吗?
【问题讨论】:
标签: kubernetes request buffer load-balancing