【发布时间】:2017-07-13 08:26:25
【问题描述】:
在推理期间,当我们通过网络传播时,我们不需要保留前一层的激活。但是,由于我们没有明确告诉程序丢弃它们,因此它没有区分训练和推理通过。有没有一种方法——也许是一个简单的标志、类、方法——在 Tensorflow 中进行这种内存管理?简单地使用tf.stop_gradient 会起作用吗?
【问题讨论】:
-
这是自动完成的。 TensorFlow 会为每个 .run 调用创建新的执行计划,因此如果您不请求渐变,这些激活将被丢弃
-
@YaroslavBulatov 感谢您的澄清!
标签: memory memory-management tensorflow