1. 模型

文章考虑了一个数据驱动的风险规避随机优化(data-driven risk-averse stochastic optimization)问题:
(DD-SP)minxXcTx+maxP^DEP^[Q(x,ξ)]\text{(DD-SP)} \quad \mathop{\min}\limits_{x\in X} c^Tx + \mathop{\max}\limits_{\hat{\mathbb{P}}\in\mathcal{D}} \mathbb{E}_{\hat{\mathbb{P}}} [\mathcal{Q}(x,\xi)] 其中 xXx\in X是第一阶段的决策变量,第二阶段的问题为
Q(x,ξ)=minyY{d(ξ)Ty  :  A(ξ)x+Byb(ξ)},\mathcal{Q}(x,\xi) = \mathop{\min}\limits_{y\in Y} \left\{ d(\xi)^Ty \;:\; A(\xi)x + By \ge b(\xi) \right\}, 假设A(ξ)A(\xi)B(ξ)B(\xi)都关于ξ\xi连续, 随机变量ξ\xi属于某个概率空间。ξ\xi 服从的分布P^\hat{\mathbb{P}}是未知的,只知道它属于某个confidence set D={P^:dM(P0,P^)θ}\mathcal{D}=\{\hat{\mathbb{P}}: d_M(\hat{\mathbb{P}_0,\mathbb{P}})\leq \theta\}.

特别地,文中考虑的是一组经验数据 ξ1,,ξN\xi^1,\cdots,\xi^N给定的经验分布为中心的Wasserstein Ball。文章主要的贡献就是,给出了 maxP^DEP^[Q(x,ξ)]\mathop{\max}\limits_{\hat{\mathbb{P}}\in\mathcal{D}} \mathbb{E}_{\hat{\mathbb{P}}} [\mathcal{Q}(x,\xi)] 的 worst-case distribution,从而给出了 DD-SP 的reformulation

2. 主要结果

假设1. DD-SP有相对完备的补偿( relatively complete recourse)并且是有界的,亦即对任意xXx\in X,都有supξΩQ(x,ξ)<\mathop{\sup}\limits_{\xi\in\Omega} |\mathcal{Q}(x,\xi)|<\infty.

命题1(原文Proposition 2). 假设 ξ1,,ξN\xi^1,\cdots,\xi^N 是从真实分布 P\mathbb{P} 中独立同部分(i.i.d.)选择的一组样本数据,那么对任何固定的第一阶段决策变量xXx\in\mathcal{X},我们有
maxP^DEP^[Q(x,ξ)]=minβ0{θβ+1Ni=1NmaxξΩ{Q(x,ξ)βρ(ξ,ξi)}}\mathop{\max}\limits_{\hat{\mathbb{P}}\in\mathcal{D}} \mathbb{E}_{\hat{\mathbb{P}}} [\mathcal{Q}(x,\xi)] = \mathop{\min}\limits_{\beta\ge 0} \left\{ \theta\beta + \frac{1}{N} \mathop{\sum}\limits_{i=1}^N \mathop{\max}\limits_{\xi\in\Omega}\left\{ \mathcal{Q}(x,\xi)-\beta\rho(\xi,\xi^i) \right\} \right\} 这里 ρ\rho就是用于定义Wasserstein时两个随机变量之间的距离。

定义:ρi(ξ)=ρ(ξ,ξi)\rho^i(\xi)=\rho(\xi,\xi^i)
命题1(原文Proposition 4). 假设 Q(x,ξ)\mathcal{Q}(x,\xi) 关于ξ\xi是凹的,ρi(ξ)\rho^i(\xi)是严格凸函数(比如L2L_2-范数),β\beta^*是命题1中的唯一解,那么存在maxP^DEP^[Q(x,ξ)]\mathop{\max}\limits_{\hat{\mathbb{P}}\in\mathcal{D}} \mathbb{E}_{\hat{\mathbb{P}}} [\mathcal{Q}(x,\xi)] 的一个 worst-case distribution,并且它可以表示为
P^=1Ni=1Nδξi\hat{\mathbb{P}}^*=\frac{1}{N} \mathop{\sum}\limits_{i=1}^N \delta_{\xi_*^i},其中ξi\xi_*^imaxξΩ{Q(x,ξ)βρi(ξ)}\mathop{\max}\limits_{\xi\in\Omega}\left\{ \mathcal{Q}(x,\xi)-\beta^*\rho^i(\xi)\right\}的最优解。
Remark:这个证明值得好好念,用到Helly–Bray定理。

3. Helly–Bray定理

链接:概率收敛、均方收敛、分布收敛的关系
worst-case distribution的构造( Yongpei Guan的一个paper学习笔记)
Helly–Bray定理是关于分布收敛的一个等价形式:假设 gg 是一个有界且连续的函数,随机变量XnX_n收敛于XX,则E[g(Xn)]E[g(X_n)] 收敛于E[g(X)]E[g(X)].

4. relatively complete recourse

worst-case distribution的构造( Yongpei Guan的一个paper学习笔记)
fixed recourse:是指第二阶段的系数矩阵是确定的

5. 参考文献

Chaoyue Zhao, Yongpei Guan. Data-driven risk-averse stochastic optimization with Wasserstein
metric
. Operations Research Letters

相关文章:

  • 2021-09-16
  • 2021-12-11
  • 2022-12-23
  • 2022-12-23
  • 2022-12-23
  • 2021-06-19
  • 2021-06-08
  • 2021-04-02
猜你喜欢
  • 2022-01-17
  • 2021-11-25
  • 2021-11-06
  • 2021-09-17
  • 2022-12-23
  • 2022-12-23
  • 2021-12-02
相关资源
相似解决方案