worst-case distribution的构造（ Yongpei Guan的一个paper学习笔记）

1. 模型

文章考虑了一个数据驱动的风险规避随机优化（data-driven risk-averse stochastic optimization）问题：
$\text{(DD-SP)} \quad \mathop{\min}\limits_{x\in X} c^Tx + \mathop{\max}\limits_{\hat{\mathbb{P}}\in\mathcal{D}} \mathbb{E}_{\hat{\mathbb{P}}} [\mathcal{Q}(x,\xi)]$ 其中 $x\in X$ 是第一阶段的决策变量，第二阶段的问题为
$\mathcal{Q}(x,\xi) = \mathop{\min}\limits_{y\in Y} \left\{ d(\xi)^Ty \;:\; A(\xi)x + By \ge b(\xi) \right\},$ 假设 $A(\xi)$ 和 $B(\xi)$ 都关于 $\xi$ 连续, 随机变量 $\xi$ 属于某个概率空间。 $\xi$ 服从的分布 $\hat{\mathbb{P}}$ 是未知的，只知道它属于某个confidence set $\mathcal{D}=\{\hat{\mathbb{P}}: d_M(\hat{\mathbb{P}_0,\mathbb{P}})\leq \theta\}$ .

特别地，文中考虑的是一组经验数据 $\xi^1,\cdots,\xi^N$ 给定的经验分布为中心的Wasserstein Ball。文章主要的贡献就是，给出了 $\mathop{\max}\limits_{\hat{\mathbb{P}}\in\mathcal{D}} \mathbb{E}_{\hat{\mathbb{P}}} [\mathcal{Q}(x,\xi)]$ 的 worst-case distribution，从而给出了 DD-SP 的reformulation。

2. 主要结果

假设1. DD-SP有相对完备的补偿( relatively complete recourse)并且是有界的，亦即对任意 $x\in X$ ，都有 $\mathop{\sup}\limits_{\xi\in\Omega} |\mathcal{Q}(x,\xi)|<\infty$ .

命题1（原文Proposition 2）. 假设 $\xi^1,\cdots,\xi^N$ 是从真实分布 $\mathbb{P}$ 中独立同部分(i.i.d.)选择的一组样本数据，那么对任何固定的第一阶段决策变量 $x\in\mathcal{X}$ ，我们有
$\mathop{\max}\limits_{\hat{\mathbb{P}}\in\mathcal{D}} \mathbb{E}_{\hat{\mathbb{P}}} [\mathcal{Q}(x,\xi)] = \mathop{\min}\limits_{\beta\ge 0} \left\{ \theta\beta + \frac{1}{N} \mathop{\sum}\limits_{i=1}^N \mathop{\max}\limits_{\xi\in\Omega}\left\{ \mathcal{Q}(x,\xi)-\beta\rho(\xi,\xi^i) \right\} \right\}$ 这里 $\rho$ 就是用于定义Wasserstein时两个随机变量之间的距离。

定义： $\rho^i(\xi)=\rho(\xi,\xi^i)$
命题1（原文Proposition 4）. 假设 $\mathcal{Q}(x,\xi)$ 关于 $\xi$ 是凹的， $\rho^i(\xi)$ 是严格凸函数（比如 $L_2$ -范数）， $\beta^*$ 是命题1中的唯一解，那么存在 $\mathop{\max}\limits_{\hat{\mathbb{P}}\in\mathcal{D}} \mathbb{E}_{\hat{\mathbb{P}}} [\mathcal{Q}(x,\xi)]$ 的一个 worst-case distribution，并且它可以表示为
$\hat{\mathbb{P}}^*=\frac{1}{N} \mathop{\sum}\limits_{i=1}^N \delta_{\xi_*^i}，$ 其中 $\xi_*^i$ 是 $\mathop{\max}\limits_{\xi\in\Omega}\left\{ \mathcal{Q}(x,\xi)-\beta^*\rho^i(\xi)\right\}$ 的最优解。
Remark：这个证明值得好好念，用到Helly–Bray定理。

3. Helly–Bray定理

链接：概率收敛、均方收敛、分布收敛的关系
worst-case distribution的构造（ Yongpei Guan的一个paper学习笔记）
Helly–Bray定理是关于分布收敛的一个等价形式：假设 $g$ 是一个有界且连续的函数，随机变量 $X_n$ 收敛于 $X$ ，则 $E[g(X_n)]$ 收敛于 $E[g(X)]$ .

4. relatively complete recourse

worst-case distribution的构造（ Yongpei Guan的一个paper学习笔记）
fixed recourse：是指第二阶段的系数矩阵是确定的

5. 参考文献

Chaoyue Zhao, Yongpei Guan. Data-driven risk-averse stochastic optimization with Wasserstein
metric. Operations Research Letters