【发布时间】:2022-11-09 16:49:33
【问题描述】:
我正在尝试 Neo 编译 Pytorch YoloV5 大型模型,以便在 Nvidia Jetson Xavier NX 设备上进行边缘部署。我可以使用 FP32 精度的默认设置来做到这一点,但我无法做到 FP16 或 INT8 精度。我尝试在OutputConfig 的“CompilerOptions”中传递它,但 Neo 编译的输出仍然是 FP32。
Neo 如何编译 FP16 和 INT8 精度的模型?
【问题讨论】:
标签: amazon-web-services amazon-sagemaker amazon-sagemaker-compilers