生产 - 加载文件以进行快速计算的最佳方法是什么？

【问题标题】：production - What is the best way to load a file for fast computation?生产 - 加载文件以进行快速计算的最佳方法是什么？
【发布时间】：2020-04-23 20:44:54
【问题描述】：

我正在部署一个深度学习模型并将 keras 模型保存为 .h5 文件。我认为复杂的模型会使其尺寸变大，因此在服务器上的交互会变慢，但是除了减少模型中的层之外，我还能做些什么呢？是否有一种压缩 .h5 文件以便为服务器更快地加载它的方法？

谢谢

【问题讨论】：

标签： tensorflow keras deployment deep-learning

【解决方案1】：

有办法做到这一点。

您要查找的内容称为quantization。

不一定要减少相当于模型修剪的层数，quantization 通过修改权重的精度（甚至在某些情况下甚至是激活）来减少模型的大小和延迟。

有关更多详细信息，请阅读 TensorFlow 官方文档中的此页面：https://www.tensorflow.org/lite/performance/post_training_quantization

【讨论】：

猜你喜欢

1970-01-01
2019-08-13
1970-01-01
1970-01-01
2014-05-04
2010-09-30
1970-01-01
2023-03-13
1970-01-01

相关资源

下载 2022-12-02
下载 2023-01-15
下载 2023-04-07

最近更新更多

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode