【发布时间】:2012-02-06 16:49:28
【问题描述】:
我已经实现了批量和随机梯度下降。我遇到了一些问题。这是随机规则:
1 to m {
theta(j):=theta(j)-step*derivative (for all j)
}
我遇到的问题是,即使成本函数变得越来越小,但测试表明它并不好。如果我稍微改变一下步骤并改变迭代次数,成本函数的值会更大一些,但结果还可以。这是过拟合的“症状”吗?我怎么知道哪一个是正确的? :)
正如我所说,即使成本函数被最小化,但测试表明它并不好。
【问题讨论】:
-
@MichaelJ.Barber 例如,期望值为 0.35,我得到 0.65。这是一个区别。但是,使用不同的步骤和迭代次数,我可以得到 0.35。问题是,当我获得正确的参数时,我如何才能在更大的范围内知道?
-
@MichaelJ.Barber 并且即使成本函数值更小(它更小),测试值也离正确的值很远,而价值稍大的成本函数提供了正确的值用于测试示例。
-
您应该将您的 cmets 编辑到您的问题中。谈谈如何初始化参数和正在优化的函数可能也会有所帮助。