【发布时间】:2023-03-09 06:02:01
【问题描述】:
所以我目前正在开发一个为多个 NLP 服务提供服务的 FastAPI 项目。为此,我想提供 spacy 和 huggingface 的不同模型。
由于这些模型很大,为每个发布请求加载模型时的推理时间很长。我的想法是在 FastAPI 启动时加载所有模型(在 app/main.py 中),但是,我不确定这是一个好的选择/想法还是存在一些缺点这种方法,因为模型将在缓存中(?)。 (信息:我想对项目进行 docker 化,然后将其部署在虚拟机上)
到目前为止,我无法在互联网上找到任何指导,所以我希望在这里得到一个好的答案:)
提前致谢!
【问题讨论】:
标签: deployment fastapi