【发布时间】:2021-08-07 09:39:04
【问题描述】:
我开发了一个使用 Yolo v5 的 API(基于 Flask)。我使用 Ngnix 和 Gunicorn 来提供这项服务。只需一个请求,一切都可以正常工作。不管我给10核CPU还是50核CPU,一次只回复一个请求。
权重全部在请求外加载,请求时只使用加载的权重
weights = "./x.pt"
imgsz = 640
device = ""
set_logging()
device = select_device(device)
# Load model
model = attempt_load(weights, map_location=device) # load FP32 model
stride = int(model.stride.max()) # model stride
imgsz = check_img_size(imgsz, s=stride) # check img_size
# Second-stage classifier
classify = False
if classify:
modelc = load_classifier(name='resnet101', n=2) # initialize
modelc.load_state_dict(torch.load('resnet101.pt', map_location=device)['model']).to(device).eval()
@application.route("URL", methods=['POST'])
def XXX():
...
...
...
如果有任何建议,我将不胜感激。谢谢,也对不起我的英语。
【问题讨论】:
标签: python nginx deep-learning gunicorn yolo