【发布时间】:2019-12-11 12:10:43
【问题描述】:
我正在尝试使用 onnxruntime quantization tool 量化 ONNX 模型。
我的量化代码如下:
import onnx
from quantize import quantize, QuantizationMode
# Load the onnx model
model = onnx.load('3ddfa_optimized_withoutflatten.onnx')
# Quantize
quantized_model = quantize(model, quantization_mode=QuantizationMode.IntegerOps)
# Save the quantized model
onnx.save(quantized_model, 'quantized_model.onnx')
使用这种方法后,我得到的模型是 0 维模型。我必须在 quantize 函数中传递什么参数才能获得合适的模型?
【问题讨论】:
标签: python deep-learning quantization onnx onnxruntime