【发布时间】:2021-10-02 15:28:01
【问题描述】:
问题很简单,但不知道如何在实践中实现。我想用数据集训练一个 tensorflow LSTM 模型,该数据集非常大(5000 万条记录)。我能够将数据文件加载到本地机器,但由于内存有限,机器在预处理阶段崩溃。我试图删除未使用的文件和垃圾收集来释放内存,但它没有帮助。
有什么办法,我可以单独训练一个 tensorflow 模型,例如,该模型将训练 5 次,每次只使用 1000 万条记录,然后在训练后删除 1000 万条记录以释放内存。同样的过程将重复 5 次来训练一个 tensorflow 模型。
谢谢
【问题讨论】:
-
这就是我们使用批量和小批量随机梯度下降的真正原因,实际上不需要将所有数据加载到 RAM 中。
标签: python tensorflow machine-learning data-science