【问题标题】:Short Definition of Backpropagation and Gradient Descent反向传播和梯度下降的简短定义
【发布时间】:2019-10-23 13:32:57
【问题描述】:

我需要为反向传播和梯度下降写一个非常简短的定义,我有点搞不懂它们的区别是什么。

下面的定义正确吗?:

为了计算神经元网络的权重,使用了反向传播算法。这是一个减少模型误差的优化过程。该技术基于梯度下降法。相反,每个权重对总误差的贡献是从输出层跨所有隐藏层到输入层计算的。为此,计算误差函数 E 对 w 的偏导数。生成的梯度用于调整最陡下降方向的权重:

w_new = w_old - learning_rate* (part E / part w_old)

有什么建议或更正吗?

谢谢!

【问题讨论】:

    标签: machine-learning gradient gradient-descent backpropagation


    【解决方案1】:

    第一次梯度下降只是执行反向传播的方法之一,除此之外,您的定义是正确的。我们只是将生成的结果与期望值进行比较,并尝试改变分配给每条边的权重,以使误差尽可能低。如果更改后错误增加,它会恢复到以前的状态。您选择的学习率不能太低或太高,否则会导致梯度消失或梯度爆炸问题,您将无法达到最小误差。

    【讨论】:

    • 感谢您的回答。那么这可能会更好:“执行反向传播的一种方法是通过梯度下降法”?
    • 梯度下降的问题是它有时可能会找到局部最小值而不是全局最小值,因此在这种情况下随机梯度下降效果更好。希望它有所帮助
    • 啊,你指的是不同的变体,比如 sgd、批量梯度下降和小批量,对吧?
    • 是的,根据需要选择不同
    • Okai 所以在我的定义之后,我可以写如下内容:取决于用于一次反向传播的训练数据量,我们可以执行 sgd、batch gd 或 mini batching ?:)
    猜你喜欢
    • 2018-05-14
    • 2018-01-02
    • 1970-01-01
    • 2021-05-18
    • 1970-01-01
    • 2020-01-07
    • 2016-10-31
    • 1970-01-01
    • 2019-01-27
    相关资源
    最近更新 更多