个人博客地址 Glooow,欢迎光临~~~

1. 保凸变换

前面提到过一次保凸变换,前面针对的是集合,凸集经过一定的保凸变换,映射后的集合仍然是凸集。这里复习一下

  1. 任意个凸集的交集
  2. 仿射变换
  3. 透视变换
  4. 分式线性函数

而这里要讲的是对函数经过操作以后,得到的仍然是凸函数。

1.1 正权重求和

离散情况:f=ωifi,ωi0f=\sum\omega_i f_i,\omega_i\ge0

连续情况:f=ω(y)f(y)dy,ω(y)0f=\int\omega(y)f(y)dy,\omega(y)\ge0

1.2 与仿射变换的复合函数

ff 为凸函数,则 f(Ax+b)f(Ax+b) 也为凸函数。

Remarks:反之则不一定成立,若想成立(根据后面复合函数的原理)则仿射变换应具有一定的单调性。

1.3 逐元素最大值&上确界

fif_i 均为凸函数,则 f(x)=maxi{f1(x),...,fn(x)}f(x)=\max_i\{f_1(x),...,f_n(x)\} 也为凸函数。

Remarks:这实际上可以看成是 epif=epifi\text{epi} f=\bigcap \text{epi}f_i,多个凸集的交集仍然是凸集。

若与仿射变换相结合,则可以得到 f(x)=maxi{a1Tx+b1,...,anTx+bn}f(x)=\max_i\{a_1^Tx+b_1,...,a_n^Tx+b_n\} 也是凸函数。

:根据上述结论,可以推广得到,nn 个元素中最大的 rr 的求和也是凸函数,证明很简单。

f(x,y)f(x,y) 关于 xx 是凸的,对任意 yAy\in\mathcal{A},则 g(x)=supyAf(x,y)g(x)=\sup_{y\in\mathcal{A}}f(x,y) 也是凸的。

Remarks:上述情况跟逐元素最大值是类似的,可以看成是无穷个 epigraph 的交集。

由上述结论,可以得到一个重要性质

Property:若 ff 为凸函数,则 f(x)=sup{g(x)g is affine,g(z)f(z),z}f(x)=\sup\{g(x)| g\ \text{is affine},g(z)\le f(z),\forall z\}

Remarks:上述性质所描述的事情实际上就是 ff 被很多个支撑超平面(以及更靠下的平面)紧紧的围起来了。证明过程实际上就是找到每个 xx 对应的(支撑)超平面。

凸优化学习笔记 5:保凸变换

通过上面的证明,可以得到的一个结论就是 xint domf\forall x\in \text{int dom}f,都存在一个 yy 使得
f(z)f(x)+yT(zx),zdomf f(z)\ge f(x)+y^T(z-x),\forall z\in\text{dom}f
由此可以引出**次梯度(subgradient)**的概念
f={gf(z)f(x)+gT(zx),zdomf} \partial f=\{g| f(z)\ge f(x)+g^T(z-x),\forall z\in\text{dom}f \}
注意这里得到的是一系列梯度值的集合,这个集合有以下性质

  1. f(x),if xint domf\partial f(x)\ne \varnothing, \text{if}\ x\in\text{int dom}f
  2. f(x)\partial f(x) convex and closed
  3. f(x)\partial f(x) bounded if xint domfx\in\text{int dom}f

:应用上述结论,可验证下面这些函数是凸的

  1. 集合 CC 的支撑函数(support function)定义为:SC(x)=supyCyTxS_C(x)=\sup_{y\in C}y^Tx (实际上可以将 xx 看作某个支撑超平面的法向量)
  2. 到集合 CC 的最远距离:f(x)=supyCxyf(x)=\sup_{y\in C}\Vert x-y\Vert (距离关于 x,yx,y 都是凸的)
  3. 矩阵范数:Xa,b=sup{Xva/vb}\Vert X\Vert_{a,b}=\sup\left\{\Vert Xv\Vert_a / \Vert v\Vert_b\right\} (证明过程用到了范数的等价定义,可参考 Boyd 的书)

1.4 下确界

前面提到了逐元素上确界,实际上就是 epigraph 的交集,而取下确界呢?是类似的,只不过对 f(x,y)f(x,y) 的要求更严了

f(x,y)f(x,y) 关于 (x,y)(x,y) 是凸的,CC 是一个凸集,则 g(x)=infyCf(x,y)g(x)=\inf_{y\in C}f(x,y) 是凸的。

上述性质可应用下确性质定义来证明,也可以从 epigraph 角度来理解:(x,t)epi g\forall(x,t)\in\text{epi }g,都有 (x,y,t)epi f, for some yC(x,y,t)\in \text{epi }f,\text{ for some }y\in C,所以 epi g\text{epi }g 实际上可以看作 epi f\text{epi }f 向低维空间中的一个投影,也是一个仿射变换/线性变换,因此 epi g\text{epi }g 也是凸的。

Remarks:注意上面还要求 CC 是一个凸集,因为凸函数要求其定义域也为凸集。

:到集合 CC 最近距离:dist(x,S)=infySxy\text{dist}(x,S)=\inf_{y\in S}\Vert x-y\Vert 是凸的,如果 SS 是凸的。

1.5 复合函数

两个凸函数的复合函数不一定是凸的,比如 f(x)=x,g(x)=x2f(x)=-x,g(x)=x^2,那么 f(g(x))=x3f(g(x))=-x^3 非凸

1. 标量复合函数

有函数 g:RnR, h:RRg:R^n\to R,\ h:R\to R,对于复合函数 f(x)=h(g(x))f(x)= h(g(x))

  1. f(x)f(x) 为凸函数,若 gg convex,hh convex,hh 单调不减
  2. f(x)f(x) 为凸函数,若 gg concave,hh convex,hh 单调增

2. 向量复合函数

有函数 g:RnRk, h:RkRg:R^n\to R^k,\ h:R^k\to R,对于复合函数 f(x)=h(g(x))=h(g1(x),...,gn(x))f(x)= h(g(x))=h(g_1(x),...,g_n(x))

  1. f(x)f(x) 为凸函数,若 gig_i convex,hh convex,hh 关于每个元素都单调不减
  2. f(x)f(x) 为凸函数,若 gig_i concave,hh convex,hh 关于每个元素都单调增

证明:标量函数 f(x)=h(g(x))g(x)2+h(g(x))g(x)f^{\prime \prime}(x)=h^{\prime \prime}(g(x)) g^{\prime}(x)^{2}+h^{\prime}(g(x)) g^{\prime \prime}(x)

向量复合函数 f(x)=g(x)T2h(g(x))g(x)+h(g(x))Tg(x)f^{\prime \prime}(x)=g^{\prime}(x)^{T} \nabla^{2} h(g(x)) g^{\prime}(x)+\nabla h(g(x))^{T} g^{\prime \prime}(x)

Remarks

  1. 回到刚开始提到仿射变换与凸函数的复合 f(Ax+b)f(Ax+b) 是凸的,但是 Affine(f(x))Affine(f(x)) 就不一定了,若是凸函数则需要仿射变换具有一定的单调性

:常见的例子有

  1. expg(x)\exp g(x) 是凸的,如果 g(x)g(x) 是凸的
  2. 1/g(x)1/g(x) 是凸的,如果 g(x)g(x) 是凸的且为正值
  3. loggi(x)\sum\log g_i(x) 为凹的,如果 gig_i 是凹的且为正值
  4. logexpgi(x)\log\sum\exp g_i(x) 为凸的,如果 gig_i 为凸的

1.6 透射变换

函数 f:RnRf:R^n\to R 的透射变换 g:Rn×RRg:R^n\times R\to R 定义为
g(x,t)=tf(x/t),dom g={(x,t)x/tdom f,t>0} g(x,t)=tf(x/t),\text{dom }g=\{(x,t)|x/t \in\text{dom }f,t>0 \}

ff 是凸的,则 gg 是凸的。

Remarks:上述变换在一些问题中应该能够对应一些物理意义,不过我暂时还没想起来。证明也可以用 epigraph 来证明。

:对负熵 f(x)=logxf(x)=-\log x,相对熵为 g(x,t)=tlogttlogxg(x,t)=t\log t-t\log x

类似的,对向量函数 KL(u,v)=(uilog(ui/vi)ui+vi)KL(u,v)=-\sum(u_i\log(u_i/v_i)-u_i+v_i) 也是凸的,这实际上就就是 KL-divergence。

相关文章:

  • 2021-08-19
  • 2021-05-02
  • 2021-04-27
  • 2021-08-23
  • 2021-12-12
  • 2021-04-17
  • 2021-06-14
  • 2021-11-23
猜你喜欢
  • 2022-12-23
  • 2021-10-09
  • 2022-01-11
  • 2021-11-04
  • 2021-10-16
  • 2022-01-04
  • 2021-06-17
相关资源
相似解决方案