文献阅读（56）

文章目录

1 缩写 & 引用
2 abstract & introduction

题目：Deep Compression compressing deep neural networks with pruning, train quantization and huffman coding
时间：2016
会议：ICLR
研究机构：韩松
可以参考的博客：https://blog.csdn.net/u013082989/article/details/77915375

1 缩写 & 引用

2 abstract & introduction

文献阅读（56）
提出的deep compression分三步：减枝、量化、霍夫曼编码

减枝：权重小于阈值的就去掉，这样就可以用稀疏矩阵的格式如CSR和CSC来存储权重
量化：利用了weight sharing，存一个对照表，这样就只需要存index而不是确定的值，实现过程用到了k-means，当然也要retrain
霍夫曼编码：权重的index、稀疏矩阵的index都不是均匀的，这就适合霍夫曼压缩了

文献阅读（56）

文献阅读（56）

相关文章：

猜你喜欢

相关资源

相似解决方案

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode