Proximal Algorithms

定义

f:RnR{+}f: \mathrm{R}^n \rightarrow \mathrm{R} \cup \{+ \infty \}为闭的凸函数,即其上镜图:
epif={(x,t)Rn×Rf(x)t} \mathbf{epi} f = \{ (x, t) \in \mathrm{R}^n \times \mathrm{R}| f(x) \le t\}
为非空闭的凸集,定义域:
domf={xRnf(x)<+} \mathbf{dom} f = \{x \in \mathrm{R}^n| f(x) < + \infty\}

近端算子(是这么翻译的?)proximal operator proxf:RnRn\mathbf{prox}_f: \mathrm{R}^n \rightarrow \mathrm{R}^n定义为:
Proximal Algorithms 1 介绍
我们常常会对添加一个比例系数λ\lambda,而关心λf\lambda f的近端算子:
Proximal Algorithms 1 介绍
注:等式右边乘以一个常数λ\lambda便是λf\lambda f的形式,所以是等价的。

解释

图形解释

Proximal Algorithms 1 介绍
注:图中的细黑线是函数ff的等值线,而粗黑线表示定义域的边界。在蓝色的点处估计其proxf\mathbf{prox}_f得到红色的点。

可以发现,proxf(v)\mathbf{prox}_f(v)实际上是对点vv附近的一个估计。

梯度解释

假设λ\lambda很小,且ff可微,那么,容易知道f(x)+12λxv22f(x) + \frac{1}{2\lambda}\|x-v\|_2^2取得极值(实际上也是最值)的条件是:
f(x)+xvλ=0x=vλf(x)vλf(v) \nabla f(x) +\frac{x-v}{\lambda}=0 \Rightarrow x=v-\lambda \nabla f(x) \approx v-\lambda \nabla f(v)
可以看到,proxf(v)\mathbf{prox}_f(v)近似为在vv点的梯度下降,而λ\lambda为步长。

一个简单的例子

有一个问题,就是,如果我们的目的是最小化f(x)f(x),那么利用proxf\mathbf{prox}_f会不会太愚蠢了,既然我们能求解proxf\mathbf{prox}_f,那么直接最小化f(x)f(x)应该也不是难事吧。这个问题留到以后再讨论吧,我也不知道能否找到一个恰当的例子来反驳。

ff是一个示性函数:
Proximal Algorithms 1 介绍
其中C\mathcal{C}为非空凸集,我们来看看这个时候的proxf(v)\mathbf{prox}_f(v):
proxλf(v)=argminx IC(x)+12λxv22 \mathbf{prox}_{\lambda f}(v)= \mathrm{argmin}_x \: I_{\mathcal{C}}(x) + \frac{1}{2 \lambda}\|x-v\|_2^2
首先,我们可以确定xCx \in \mathcal{C}, 否则结果为无穷,所以,问题可以转化为一个Euclid范数下投影问题:
Proximal Algorithms 1 介绍
所以一个问题是,如果proxf\mathbf{prox}_f的尾项不用2\ell_2范数,用别的范数会变成什么样?

相关文章:

  • 2021-12-02
  • 2021-12-31
  • 2021-09-07
  • 2021-08-05
  • 2021-12-26
  • 2021-07-24
  • 2021-06-24
  • 2021-06-13
猜你喜欢
  • 2021-07-01
  • 2021-11-20
  • 2021-05-05
  • 2021-12-18
  • 2022-12-23
  • 2022-12-23
  • 2021-12-03
相关资源
相似解决方案