【发布时间】:2018-02-02 10:55:45
【问题描述】:
我正在使用auto-sklearn 根据一些数据生成回归模型。运行几个小时后,我将生成的模型保存到磁盘以供以后与 joblib 一起使用,生成的文件大小为 2.5 GiB。
如何减小已保存模型的文件大小?我只需要能够对未来的模型进行预测即可。
【问题讨论】:
标签: python python-3.x machine-learning scikit-learn automl
我正在使用auto-sklearn 根据一些数据生成回归模型。运行几个小时后,我将生成的模型保存到磁盘以供以后与 joblib 一起使用,生成的文件大小为 2.5 GiB。
如何减小已保存模型的文件大小?我只需要能够对未来的模型进行预测即可。
【问题讨论】:
标签: python python-3.x machine-learning scikit-learn automl
根据您使用的模型类型,很有可能您绝对不能。 如果你有这么大的模型,我猜它是神经网络或随机森林模型。不幸的是,没有简单的方法可以做到这一点,如果这样做,您很可能会降低准确性。
对于神经网络,没有办法做到这一点,只能降低网络的复杂性。 对于随机森林,您可以查看 Tree Pruning,但我认为您不会获得大量内存。
如果您的问题是:模型中是否有任何东西只对训练有用,我可以删除 => 可能是一些变量,没有什么大到值得您花时间的(最多几 KB)。
【讨论】: