【发布时间】:2016-09-07 12:42:09
【问题描述】:
在 Kubernetes 中是否有一个配置,我可以在其中指定在生成新实例之前排队的最小请求数?
这是上下文:我们为我们的用例设置了强大的高 CPU 机器,每个请求都会在服务器上产生大量负载。一切都很完美,直到我们达到特定的数字,比如说...... 300 个请求,加速时间为 100 毫秒。从那时起,我们会在一段时间内收到 Connection refused 错误,然后一旦产生新机器,服务器就会开始处理它们。处理负载峰值的最佳方法是什么?我正在应用程序引擎中寻找类似“等待延迟”的配置。我的应用程序部署在 Google 计算引擎上并由 Kubernetes 编排。
【问题讨论】:
标签: google-compute-engine kubernetes google-cloud-platform