https://arxiv.org/abs/1603.08155

 

两个网络:image transfer网络和loss网络

image transfer网络:

将输入图片y通过映射f W (x)得到输出图片ŷ (ŷ = f W (x))

loss网络(取预训练好的VGG)

原因:VGG是用来做图像分类的,预训练好的VGG网络已经可以学习对感知信息和语义信息进行编码,使用VGG作为固定的损失网络来定义损失函数。

其中损失函数包括两部分:

1.内容损失:

perceptual loss

perceptual loss

 

2.风格损失:

 

perceptual loss

perceptual loss

φ j (x)是输入x在第j层卷积层上输出的特征图,定义损失函数中的Gram matrix G φj (x):perceptual loss

网络结构:

perceptual loss

损失网络实际上只是取代了我们常用的L2 loss等函数,image transform net的输入分别是style target和content target;两张图片,得到的输出为一张既包含content也包含style的图片ŷ,接着ŷ分别与gt图像和style图像做回归。

相关文章:

  • 2021-11-26
  • 2022-01-20
  • 2021-04-21
  • 2021-12-02
  • 2021-11-18
  • 2022-12-23
  • 2021-07-04
猜你喜欢
  • 2021-08-03
  • 2021-11-15
  • 2022-02-07
  • 2021-11-11
  • 2021-09-18
相关资源
相似解决方案