【发布时间】:2015-03-23 21:41:40
【问题描述】:
我了解在 SGD 中,我们会更新权重 w.r.t。到单个训练示例,例如:
for i in range(m):
weights = weights + (alpha * gradient) # for each i in m
然后我们是根据这个单次更新还是在整个训练集运行之后计算新的均方误差(我的成本函数)?
【问题讨论】:
我了解在 SGD 中,我们会更新权重 w.r.t。到单个训练示例,例如:
for i in range(m):
weights = weights + (alpha * gradient) # for each i in m
然后我们是根据这个单次更新还是在整个训练集运行之后计算新的均方误差(我的成本函数)?
【问题讨论】:
基于一次更新。梯度是使用单个训练示例估计的,然后用于更新您的权重。更新后,您可以计算新的损失函数,看看您的优化效果如何。
【讨论】: