3. Semantic Image Synthesis
定义为semantic segmentation mask,其中是一系列整数用于指定semantic label
Spatially-adaptive denormalization
定义为CNN的第层的包含个样本的feature map
本文提出一种新的conditional normalization方法,称为SPatially-Adaptive (DE)normalization(SPADE),如Figure 2所示
在SPADE输出的feature map中,下标为的值的计算方式如下
以上公式中,首先将输入feature map按照channel维度归一化为零均值单位方差,然后将送入simple two-layer convolutional network,来学习用于denormalization的modulation parameter,即和
SPADE可以看作已有normalization方法的通用的版本
SPADE generator
因为SPADE接收作为输入,于是对于生成器的输入层就不需要输入了
和已有的class-conditional generator结构类似,生成器的输入只包含一个random vector
Figure 4展示了生成器的结构,其中利用SPADE layer构造了SPADE ResBlock
【总结】
本文的创新点在于提出了一种新的normalization方法,SPADE,具备更加通用的性质,已有的normalization方法都可以看走它的特例,通过SPADE的通用型,可以自适应地学习denormalization的参数,从而生成质量更好的图像