（笔记）网络压缩量化，训练三值量化TRAINED TERNARY QUANTIZATION

原文链接：
摘要
方法
实验效果
讨论

原文链接：

摘要

提供一个三值网络的训练方法。对AlexNet在ImageNet的表现，相比32全精度的提升0.3%。

方法

对于每一层网络，三个值是32bit浮点的 ${- W_{l}^{n}, 0, W_{l}^{p}}$ ， $W_{l}^{n}$ 、 $W_{l}^{p}$ 是可训练的参数。另外32bit浮点的模型也是训练的对象，但是阈值 $Δ_{l}$ 是不可训练的。
由公式(6)从32bit浮点的到量化的三值：
（笔记）网络压缩量化，训练三值量化TRAINED TERNARY QUANTIZATION
由(7)算出 $W_{l}^{n}$ 、 $W_{l}^{p}$ 的梯度

其中

由(8)算出32bit浮点模型的梯度

由(9)给出阈值，这种方法在CIFAR-10的实验中使用阈值t=0.05。而在ImageNet的实验中，并不是由通过钦定阈值的方式进行量化的划分，而是钦定0值的比率r，即稀疏度。
（笔记）网络压缩量化，训练三值量化TRAINED TERNARY QUANTIZATION