【发布时间】:2016-07-19 18:57:25
【问题描述】:
我目前正在 TensorFlow 中实现 YOLO,我对占用的内存量感到有些惊讶。在我的 GPU 上,我可以使用他们的 Darknet 框架以批量大小 64 训练 YOLO。在 TensorFlow 上,我只能以批量大小 6 来训练,而 8 的内存已经用完。对于测试阶段,我可以使用 64 的批处理大小运行而不会耗尽内存。
我想知道如何计算每个张量消耗了多少内存?默认情况下所有张量都保存在 GPU 中吗?我可以简单地将总内存消耗计算为形状 * 32 位吗?
我注意到,由于我使用了动量,所以我所有的张量也有一个
/Momentum张量。会不会也占用了很多内存?我正在使用
distorted_inputs方法扩充我的数据集,该方法与CIFAR-10 tutorial 中定义的方法非常相似。莫非这部分占用了很大的内存?我相信 Darknet 会在 CPU 中进行修改。
【问题讨论】:
标签: tensorflow