生成对抗性网络(Generative Adversarial Network,GAN)是生成建模的一种神经网络结构。生成模型涉及使用一个模型来生成新的例子,这些例子似乎来自于现有的样本分布,例如生成新的照片,这些照片与现有的照片数据集相似,但还是有不同。

一个 GAN 是一个生成模型,使用双神经网络模型进行训练。其中一个模型被称为"生成器"或"生成网络"模型,用于学习生成新的看似合理的样本;另一个模型被称为"判别器"或"判别网络",它学习区分生成的例子和真实例子。这两个模型是在对抗或博弈中建立的,其中生成器模型试图欺骗鉴别器模型,鉴别器提供了实际样本和生成样本的两个例子。经过训练后,生成模型可以根据需要创建新的相似样本。GAN有许多具体的用例,在这篇文章中,我们将回顾大量有趣的GAN应用程序,以帮助大家对可用和有用的问题类型形成直觉,它包含了许多已经在现实中使用的 GANs 的例子。

我们将GAN分为以下几个领域应用,相关的程序和代码可以在github[1] 上找到。

1.为图像数据集生成新的示例:

伊恩 · 古德费勒等人在2014年的论文《生成对抗性网络》[2]中描述了产生新的相似样本的应用,在这篇论文中,作者用 GANs 为 MNIST 手写数字数据集、 CIFAR-10数据集和面部数据库产生了新的相似样本:

GAN研究方向汇总(附源码)
来自论文

Alec Radford 等人在2015年发表的题为"深度卷积生成对抗性网络的非监督表征学习"[3]的重要论文中所使用的演示,该论文演示了如何在一定规模上训练稳定的 GANs。他们演示了生成卧室的新例子的模型:

GAN研究方向汇总(附源码)
来自论文

2.生成人脸照片:

泰罗 · 卡拉斯等人在他们2017年的论文中[4]展示了生成以假乱真的真实人脸照片。他们看起来是如此的真实,我们可以说这个结果是非凡的,这个结果受到了媒体的广泛关注。这些面孔是根据名人的例子训练出来的,这意味着在生成的面孔中有现有名人的元素,使他们看起来很熟悉,但并不完全熟悉:

GAN研究方向汇总(附源码)
来自论文

他们的方法也被用来演示对象和场景的生成:

GAN研究方向汇总(附源码)

2018年的一份题为《人工智能的恶意使用: 预测、预防和缓解》[5]的报告中使用了这篇论文中的例子,以展示2014年至2017年间GAN的快速发展。

3.生成逼真的照片:

安德鲁 · 布洛克等人在他们2018年发表的论文[6]中展示了利用 BigGAN 技术生成的合成照片,这些合成照片与真实照片几乎没法区分:

GAN研究方向汇总(附源码)
来自论文

4.生成卡通人物:

金同学等人在他们2017年的论文[7]中展示了如何训练和使用 GAN 来生成动漫人物的面孔:

GAN研究方向汇总(附源码)
来自论文

5.图像到图像的翻译:

Phillip Isola 等人在他们2016年的论文[8]中展示了使用 GANs和 pix2pix 方法用于图像到图像的翻译任务:

GAN研究方向汇总(附源码)
来自论文

朱同学在他们2017年的论文[9]中介绍了他们著名的 cycleGAN[10] 和一系列令人印象深刻的图像到图像的翻译例子。

6.文本到图像的翻译:

Han Zhang 等人在他们2016年发表的论文[11]中展示了 GANs 的使用,主要是StackGAN,通过对简单物体如鸟儿和花朵的文本描述生成看起来很真实的照片:

GAN研究方向汇总(附源码)
来自论文

7.语义-图像-照片翻译:

王同学等人在他们2017年题为"高分辨率图像合成和条件 GANs 语义操作"的论文[12]中演示了使用条件 GANs 生成真实感图像,并给出语义图像或草图作为输入,他们还演示了用于操作生成图像的交互式编辑器:

GAN研究方向汇总(附源码)
语义图像和 GAN 生成的城市景观照片,来自论文

8.面部正面视图的生成:

黄同学等人在他们2017年题为"超越面部旋转: 全局和局部感知 GAN 的真实感和保持身份的正面视图合成"的论文中,演示了用 GANs 生成人脸正面视图(即正面对视)的方法,并给出了从某个角度拍摄的照片:

GAN研究方向汇总(附源码)
来自论文

9.生成新的人体姿势:

马同学等人在他们2017年题为"基于姿势的人像生成"的论文[13]中提供了一个生成新姿势的人体模特新照片的例子:

GAN研究方向汇总(附源码)

10.照片生成脸萌:

Yaniv Taigman 等人在他们2016年题为"无监督跨域图像生成"的论文[14]中,使用 GAN 将图像从一个域翻译到另一个域,包括从街道号码到 MNIST 手写数字,从名人照片到他们所代表的表情符号或小卡通脸孔:

GAN研究方向汇总(附源码)

11.图片编辑:

Guim Perarnau 等人在他们2016年题为"基于可逆条件GANs的图像编辑"的论文[15]中使用了一个GAN,特别是他们的 IcGAN来重建具有特定特征的人脸照片,比如头发颜色、风格、面部表情,甚至性别的变化:

GAN研究方向汇总(附源码)刘同学等人在他们2016年题为"耦合的生成对抗性网络"的论文[16]中也探索了具有特定属性的面孔的生成,比如头发颜色、面部表情和眼镜。他们还探索其他图像的生成,如不同颜色和深度的场景。Andrew Brock 等人在他们2016年的论文[17]中展示了一个使用变分自动编码器和 GANs 的混合体的面部照片编辑器。该编辑器允许快速真实地修改人脸,包括改变头发颜色、发型、面部表情、姿势和添加面部毛发。何同学等人在他们2017年的论文[18]中使用GAN进行图像编辑,包括从照片中去除雨和雪等例子。

12.面部老化:

格里戈里 · 安蒂波夫等人在他们2017年题为"有条件的生成对抗性网络的面部老化"的论文[19]中使用 GANs 生成不同年龄的面部照片,从年轻到年长:

GAN研究方向汇总(附源码)

张同学在他们2017年发表的题为"年龄增长 / 条件对抗性自动编码器的回归"的论文[20]中,使用了一种基于 GAN 的方法来去除人脸照片的老化。

13.照片混合:

吴同学等人在他们2017年的论文[21]中展示了GAN在混合照片中的应用,特别是来自不同照片的元素,如田野、山脉和其他大型结构融合:

GAN研究方向汇总(附源码)
来自论文

14.增强分辨率:

Christian Ledig 等人在他们2016年的论文[22]中展示了 GANs 的使用,他们的 SRGAN 模型用来产生更高,有时甚至超高像素分辨率的图像输出。黄同学等人在他们2017年的论文[23]中使用GAN创建不同分辨率的人脸照片:

GAN研究方向汇总(附源码)

Subeesh Vasu 等人在他们2018年的论文[24]中提供了一个用GAN创建高分辨率照片的例子,聚焦于街景。

15.图片修补:

迪帕克 · 帕塔克等人在他们2016年的论文[25]中描述了 GANs 的使用来执行照片修改或孔洞填充,即填充一个由于某种原因被删除的照片区域:

GAN研究方向汇总(附源码)

Raymond a. Yeh 等人在他们2016年题为"深层生成模型的语义图像修复"的论文[26]中使用 GANs 来填充和修复故意损坏的人脸照片。李同学等人在他们2017年的论文[27]中也使用 GANs 来修复和重建人脸的损坏照片。

16.服饰翻译:

Donggeun Yoo等人在其2016年题为"像素级域转移"的论文[28]中展示了使用 GANs 生成服装照片的方法,这些照片可以在目录或网上商店中看到:

GAN研究方向汇总(附源码)

17.视频预测:

Carl Vondrick 等人在他们2016年发表的题为"使用场景动态生成视频"的论文[29]中描述了GAN在视频预测中的应用,特别是成功地预测了多达一秒的视频帧,主要是预测场景中的静态元素:

GAN研究方向汇总(附源码)

18.3d对象生成:

吴同学等人在他们2016年的论文[30]中展示了一个 GAN用于生成新的三维物体(例如3D 模型)的例子 ,如椅子、汽车、沙发和桌子:

GAN研究方向汇总(附源码)
来自论文

Matheus Gadelha 等人在他们2016年题为"从多个物体的2D 视图进行3D 形状归纳"的论文[31]使用 GANs 从多个角度给出物体的二维图片,从而生成三维模型。

参考

  1. ^https://github.com/nashory/gans-awesome-applications

  2. ^https://arxiv.org/abs/1406.2661

  3. ^https://arxiv.org/abs/1511.06434

  4. ^https://arxiv.org/abs/1710.10196

  5. ^https://arxiv.org/abs/1802.07228

  6. ^https://arxiv.org/abs/1809.11096

  7. ^https://arxiv.org/abs/1708.05509

  8. ^https://arxiv.org/abs/1611.07004

  9. ^https://arxiv.org/abs/1703.10593

  10. ^https://junyanz.github.io/CycleGAN/

  11. ^https://arxiv.org/abs/1612.03242

  12. ^https://arxiv.org/abs/1711.11585

  13. ^https://arxiv.org/abs/1705.09368

  14. ^https://arxiv.org/abs/1611.02200

  15. ^https://arxiv.org/abs/1611.06355

  16. ^https://arxiv.org/abs/1606.07536

  17. ^https://arxiv.org/abs/1609.07093

  18. ^https://arxiv.org/abs/1701.05957

  19. ^https://ieeexplore.ieee.org/document/8296650

  20. ^https://arxiv.org/abs/1702.08423

  21. ^https://arxiv.org/abs/1703.07195

  22. ^https://arxiv.org/abs/1609.04802

  23. ^https://arxiv.org/abs/1707.00737

  24. ^https://arxiv.org/abs/1811.00344

  25. ^https://arxiv.org/abs/1604.07379

  26. ^https://arxiv.org/abs/1607.07539

  27. ^https://arxiv.org/abs/1704.05838

  28. ^https://arxiv.org/abs/1603.07442

  29. ^https://arxiv.org/abs/1609.02612

  30. ^https://arxiv.org/abs/1610.07584

  31. ^https://arxiv.org/abs/1612.05872

GAN研究方向汇总(附源码)

人工智能从入门到精通,知识星球社区特邀两位大佬为您答疑解惑!

GAN研究方向汇总(附源码)

GAN研究方向汇总(附源码)

相关文章: