【发布时间】:2023-03-13 11:45:01
【问题描述】:
我的 fastapi 服务器在更新为使用小型模型中的 spacy_en_core_web_lg 后内存不足。
在运行 fastapi 时,会产生 4 个 gunicorn 工作人员,并且根据内存使用情况,我认为每个工作人员都在加载模型。有没有办法可以在工作人员之间共享模型,所以我不需要在每个工作人员中加载它?
【问题讨论】:
-
为模型创建一个单独的线程或其他任何内容,并让每个人都与它交谈。如果这很复杂,请使用模型和一个工作人员设置一个单独的服务器,并让每个人都与之交谈。
-
是的,我正在考虑为模型配备一个专用服务器——这肯定会让事情变得复杂