【发布时间】:2018-01-30 22:34:50
【问题描述】:
尝试使用
最小化 sigmoid 曲线f(x)=1/(1+exp(-x))(在负无穷处收敛到零,在无穷远处收敛到 1)
scipy.optimize.minimize(lambda x: 1/(1+np.exp(-x)),100,hess=lambda x:-(np.exp(x)*(np.exp(x)-1))/(np.exp(x)+1)**3,jac = lambda x:1/(np.exp(-x/2)+np.exp(x/2))**2,method = 'Newton-CG')
我得到以下输出:
fun: array([ 1.])
jac: array([ 3.72007598e-44])
message: 'Warning: Desired error not necessarily achieved due to precision loss.'
nfev: 19
nhev: 1
nit: 0
njev: 7
status: 2
success: False
x: array([ 100.])
这意味着,算法只是停止在它所在的位置,并声称最小值是 f(100)=1,而实际上它是 f(-infinity)=0。这个答案只看x=100 的微小导数是合理的(并且考虑到最小值只能在一定的容错范围内找到),但是负二阶导数(hessian)意味着x=100 甚至不接近局部最小值。
如何避免警告消息,以及如何强制算法继续运行,直到它至少找到hess(x)>0 的位置?请注意,Jacobian 和 Hessian 实际上都没有遇到数值稳定性问题;确实是jac(100)>0 和hess(100)<0,最小化器应该能够从中得出尚未达到最优值的结论。
PS:这当然只是一个玩具问题,但我相信它抓住了我的实际应用程序失败的要领。另外,我不打算使用 Newton-CG,但是当 jacobian 像上面的例子一样小时,不能期望任何不使用二阶导数的方法继续,所以我确实想使用一种利用的方法二阶导数信息
我正在使用 Python3.6.3 和 scipy0.19.1
【问题讨论】:
-
x=100 处的粗麻布为 -3.7e-44。虽然这是负数,但它太小了,实际上无法与 0 区分开来。换句话说,该区域的曲线太平,对优化器没有意义。在这种情况下,我倾向于使用
differential_evolution。如果您想确保有一个合理的最小值,您可以进一步将结果作为起点传递给基于梯度的优化例程。 -
"... 并声称最小值为 f(100)=1 ..." 它没有声明这一点。看看输出!它在那里说:“警告:由于精度损失,不一定会实现所需的错误。”和
success: False。这意味着它没有找到最小值就停止了。
标签: python scipy minimization