【发布时间】:2020-09-16 18:47:01
【问题描述】:
我一直在玩 tensorflow 中的自动渐变,我有一个问题。如果我们正在更新优化器,比如 ADAM,那么动量算法何时应用于梯度?是在调用tape.gradient(loss,model.trainable_variables) 还是调用model.optimizer.apply_gradients(zip(dtf_network,model.trainable_variables)) 时应用?
谢谢!
【问题讨论】:
标签: python tensorflow adam