【发布时间】:2021-07-05 17:41:52
【问题描述】:
我使用 Flask 编写了一个 Web 应用程序模型,并将其部署到 Google 计算引擎上的 VM 实例。后端是机器学习模型。我可以通过外部 IP 访问此应用程序。但是,如果两个或更多用户尝试使用此应用程序预测某事,它就会崩溃。我认为解决方案是水平扩展 vm 实例,以便更多用户可以访问。
我查看了 google 文档和下面的链接以大致了解此步骤。 Use existent VM Instace (bitnami) for Autoscale Group of Instances
但我仍然对这种自动缩放的工作原理感到困惑。
- vm实例模板不包含文件和虚拟环境,如何自定义这些信息到模板,还是不可能?
- 如果我将应用部署到自动生成的虚拟机实例之一,当更多人使用该应用时,新生成的实例也会与第一个完全相同(包含Web应用的所有文件)?
【问题讨论】:
标签: web-applications google-compute-engine horizontal-scaling