【第1章】凸集——保凸运算

凸集——保凸运算

3.保凸运算

3.1交集
3.2仿射函数
3.3透视函数
3.4 线性分数函数（转换后凸性质不变）
3.5参考

Date: 2020/05/05
Editor:萧潇子（Jesse）
Contact: [email protected]

3.保凸运算

本节给出一些典型的保凸运算,利用这些保凸运算,可以从凸集构造出其他凸集.这些运算与上一节中给出的凸集例子一起构成凸集的演算,可以用来确定或者构建集合的凸性.

3.1交集

若 $S_1,S_2$ 为凸集，则 $S_1 \bigcap S_2$ 为凸

若 $S_a$ 为凸集， $\forall a\in A$ 则 $\mathop{\bigcap} \limits_{a\in A} S_a$ 为凸集

3.2仿射函数

关于仿射变换解释可参考这篇博文https://blog.csdn.net/blogshinelee/article/details/90675178

$f:\:R^n \rightarrow R^m$ 是仿射的，当 $\color{red} f(S)=AX+b$ , $A\in R^{m\times n}$ , $b\in R^m$

若 $S\in R^n$ 为凸集， $f:\:R^n \rightarrow R^m$ 仿射，则 $f(S)=\{f(X)|X\in S \}$ 为凸集

$n$ 维空间中的凸集 $S$ 经过线性变换变成 $m$ 维空间中的凸集 $f(S)$

逆仿射映射

$g:\:R^k \rightarrow R^n$ 为仿射， $g^{-1}(S)=\{X|f(X) \in S\}$

e.g.

缩放与移位是保持凸性的

缩放： $\alpha S=\{\alpha X|X\in S\}$

移位： $S+a=\{X+a|X\in S\}$

两个凸集的和是凸的：

$S_1+S_2=\{x+y|x\in S_1, y\in S_2\}$

定义 $S_1\times S_2=\{(x,y)|x\in S_1, y\in S_2\}$ 凸

假定 $x\in R,y\in R$ , 线性变换 $f(x,y)=x+y$ ,因此两个凸集的和还是凸集

线性矩阵不等式 LMT 解集也是凸集

$B,A_i,X_i\in S^m$ 对称矩阵

定义函数： $A(X)=X_1A_1+\cdots+X_nA_n\preceq B$ 表示 $(A(X)-B)\preceq 0$ 半负定矩阵

证明 $\{X|A(X)\preceq B\}$ 为凸 $X$ 由很多对称矩阵 $X_i$ 构成

首先定义仿射变换 $f(X) \triangleq B-A(X)$ $\Rightarrow$ 由高维矩阵变换到低维矩阵空间

$f(X)$ 每个点是由多个矩阵$X_i $构成，$ B-A(X)$每个点是一个矩阵

$f^{-1}(S_+^n)=\{X|B-A(X) \succeq 0\}$

$S_+^n$ 为凸，经过 $f^{-1}(S_+^n)$ 逆仿射映射 $\{X|B-A(X) \succeq 0\}$ 也为凸

由于 $B-A(X)$ 为凸，也即 $f(X)$ 也是凸的， $f(X)$ 逆运算符合仿射运算，所以其解集 $\{X|A(X)\preceq B\}$ 为凸

椭球是球的仿射映射
$\xi(x_c,P)=\{x\:| (x-x_c^T)P^{-1}(x-x_c) \:\le 1\} \qquad x_c\in R^n \quad P\in S_{++}^{n}(对称正定矩阵几何)$

单位球 $\{u\: |\parallel u \parallel _2 \le 1\}$

仿射函数 $f(u)=P^{\frac{1}{2}} u+x_c$ 其中 $(P^{\frac{1}{2}})(P^{\frac{1}{2}})=P$

$\{f(u)\:|\parallel u \parallel _2 \le 1\}= \{P^{\frac{1}{2}} u+x_c\:|\parallel u \parallel _2 \le 1\}$ 定义 $x=P^{\frac{1}{2}} u+x_c\Leftrightarrow u=P^{-\frac{1}{2}}(x-x_c)$

$\Rightarrow$ $\{x\: |\parallel P^{-\frac{1}{2}}(x-x_c) \parallel _2 \le 1\}$

$\Rightarrow$ $\{x\: |(x-x_c)^T P^{-1} (x-x_c) \le 1\}$

3.3透视函数

$P\quad R^{n+1} \rightarrow R^{n}$ 定义域：dom $P=R^n \times R_{++}$ 前n个元素可以在实空间里面任意取值，最后一个元素必须要是正数

定义： $P(Z,t)=\frac{Z}{t} \quad Z\in R^n \quad t\in R_{++}$

二维情况下点 $(x_1,x_2)$ 透过原点与直线 $x_2=-1$ 的交点 $(-\frac{x_1}{x_2},-1)=(-P(x_1,x_2),-1)$

这里先给出几何意义的解释,可以使用简单的小孔成像原理去理解这个过程,投影的小孔为原点,成像平面为 $x_2=-1$ ,二维平面上的点经过投影变成一维直线上的点,如下图所示:
【第1章】凸集——保凸运算

凸集经过透视函数也是凸集

考虑 $R^{n+1}$ 内线段 $x=(\mathop{\tilde{x}}\limits_{\in R^n},\mathop{x_{n+1}}\limits_{\in R_{++}})$ $y=(\mathop{\tilde{y}}\limits_{\in R^n},\mathop{y_{n+1}}\limits_{\in R_{++}})$

$1 \ge\theta \ge 0$ 线段为 $\theta x+(1-\theta)y$

证明线段经过透视函数还是线段

$x \mathop{\rightarrow} \limits^P P(x)$ $y \mathop{\rightarrow} \limits^P P(y)$

$\theta x+(1-\theta)y \mathop{\rightarrow} \limits^P P(\theta x+(1-\theta)y)$
$\begin{aligned} P(\theta x+(1-\theta)y)& = \frac{\theta \tilde{x} + (1-\theta) \tilde{y}}{\theta x_n + (1-\theta)y_{n+1}}\\ &=\frac{\theta x_{n+1}}{\theta x_{n+1}+(1-\theta)y_{n+1}}\frac{\tilde{x}}{x_{n+1}} + \frac{(1-\theta) y_{n+1}}{\theta x_{n+1}+(1-\theta)y_{n+1}}\frac{\tilde{y}}{y_{n+1}}\\ &=\mu P(x)+(1-\mu)P(y) \qquad 1 \ge\mu \ge 0 \end{aligned}$
$\theta, \mu$ 一一映射

任意凸集的反透视函数仍是凸集
$P^{-1}(C)=\{(x,t)\in R^{n+1}|\frac{x}{t} \in C, \quad t>0\}$
考虑 $(x,t)\in P^{-1}(C)$ $(y,s)\in P^{-1}(C)$ $0\le \theta \le 1$

证明 $(\theta x+(1-\theta)y, \theta t+(1-\theta)s) \in P^{-1}C$ 也就是要证明 :
$\frac{\theta x+(1-\theta)y} {\theta t+(1-\theta)s} \in C$

$\begin{aligned} \frac{\theta x+(1-\theta)y} {\theta t+(1-\theta)s} &=\frac{\theta t}{\theta t+(1-\theta)s} \frac{x}{t} + (1-\frac{\theta t}{\theta t+(1-\theta)s})\frac{y}{s}\\ &=\mu \mathop{\frac{x}{t}}\limits_{\in C} + (1-\mu)\mathop{\frac{y}{s}}\limits_{\in C} \\ \Rightarrow \in C \end{aligned}$

3.4 线性分数函数（转换后凸性质不变）

线性分式函数由透视函数和仿射函数复合而成

g: $R^n \rightarrow R^{m+1}$ 为仿射映射
$g(x)= \begin{bmatrix} A \\[0.3em] C^+ \end{bmatrix} x + \begin{bmatrix} b \\[0.3em] d \end{bmatrix}$
其中 $A\in R^{m\times n},C\in R^{n}, b\in R^{m}, d\in R$

P: $R^{m+1}\rightarrow R^m$ 透视函数

$f:\quad R^n \rightarrow R^m \triangleq P\circ g$

线性分数函数：
$f(x)=\frac{Ax+b}{C^Tx+d}\quad domf=\{x|C^Tx+d>0\}$
例: 两个随机变量的联合概率 $\rightarrow$ 条件概率

$u$ $v$ $\{1 \cdots n\}$ $\{1 \cdots m\}$

联合概率 $P_{i,j}=P(u=i,v=i)$

条件概率 $f_{ij}=P(u=i|v=j)$

$\because f_{ij}=\frac{P_{ij}}{\sum^n_{k=1}P_{kj}} \rightarrow \frac{[0 \cdots 1\cdots 0]\rightarrow 点乘下面向量}{[P_{1,j},\cdots,P_{n,j}] \rightarrow 向量相加} \quad 分子分母满足线性变换$

从高维变成标量

3.5参考

1、Stephen Boyd 、Lieven Vandenberghe——《Convex Optimization》）
2、中科大凌青凸优化 (https://www.bilibili.com/video/BV1Jt411p7jE?)