【问题标题】:When is Momentum Applied in Tensorflow Gradient Tape?什么时候在 Tensorflow Gradient Tape 中应用 Momentum?
【发布时间】:2020-09-16 18:47:01
【问题描述】:

我一直在玩 tensorflow 中的自动渐变,我有一个问题。如果我们正在更新优化器,比如 ADAM,那么动量算法何时应用于梯度?是在调用tape.gradient(loss,model.trainable_variables) 还是调用model.optimizer.apply_gradients(zip(dtf_network,model.trainable_variables)) 时应用?

谢谢!

【问题讨论】:

    标签: python tensorflow adam


    【解决方案1】:

    tape.gradient 直接计算梯度,无需参考优化器。由于动量是优化器的一部分,磁带包含它。 AFAIK 动量通常通过在存储运行平均值的优化器中添加额外变量来实现。所有这些都在optimizer.apply_gradients 中处理。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2021-08-20
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2010-12-30
      • 1970-01-01
      • 2021-09-07
      相关资源
      最近更新 更多