【发布时间】:2023-04-01 01:53:01
【问题描述】:
我正在尝试使用 OpenVino python API 来运行 MTCNN 人脸检测,但是,转换后的模型的性能与原始模型相比明显下降。我想知道如何获得类似的结果。
我使用以下命令将mtcnn caffe models 转换为 OpenVino *.xml 和 *.bin 文件。
python3 mo.py --input_model path/to/PNet/det1.caffemodel --model_name det1 --output_dir path/to/output_dir
python3 mo.py --input_model path/to/RNet/det2.caffemodel --model_name det2 --output_dir path/to/output_dir
python3 mo.py --input_model path/to/ONet/det3.caffemodel --model_name det3 --output_dir path/to/output_dir
并使用step_by_step mtcnn jupyter notebook检查转换后模型的性能。
但使用 OpenVino 模型的检测结果显着下降。要重新生成结果,您只需在笔记本中加载 OpenVino 模型而不是 pytorch 模型。
要重新生成我的结果,请执行以下步骤。
克隆https://github.com/TropComplique/mtcnn-pytorch.git
如你所见,P-Net 后第一阶段的检测框比原始模型中检测到的框要多step_by_step mtcnn jupyter notebook。
您对此有何评论。模型转换似乎没有问题,唯一的区别是 pytorch 具有可变张量大小(FloatTensor),但对于 OpenVino,我必须为每个比例重塑输入大小。这可能是得到不同结果的原因,但是我无法解决这个问题。
【问题讨论】:
标签: python face-detection openvino