我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的、自己不知道的东西。

这是我的李宏毅老师 GAN 系列第8篇笔记,GAN 系列:

本节内容综述

  1. 本节讲解修图的例子。
  2. Modifying Input Code ,如何找出我们输入的信息每一个元素对应的特征都是什么呢?
  3. 可以使用 GAN + Autoencoder 。
  4. 李老师又找了个 Demo ,“智能 photoshop”。并且介绍了其 Basic Idea 。
  5. 还可以用于将图像变得清晰。见 Image super resolution 。此外还有技术比如 Image Completion 。

小细节

Modifying Input Code

【李宏毅2020 ML/DL】P81 Generative Adversarial Network | Intelligent Photo Editing

GAN + Autoencoder

【李宏毅2020 ML/DL】P81 Generative Adversarial Network | Intelligent Photo Editing
如上,我们已经有了一个 Generator ,把其作为 Decoder ,固定,前面接一个 Encoder (其参数可以用 Discriminator 参数来初始),这样就可以从生成的图片x反推对应什么代码z
【李宏毅2020 ML/DL】P81 Generative Adversarial Network | Intelligent Photo Editing
如上,两个集合,长发与短发,分别得到其对应的 code ,然后分别求平均,这样就可以得到一个向量 zlongz_{long} ,用于长短发间的转换。

Basic Idea

【李宏毅2020 ML/DL】P81 Generative Adversarial Network | Intelligent Photo Editing
如上,让数据在 code space 上做一个小小的移动。

Back to z

【李宏毅2020 ML/DL】P81 Generative Adversarial Network | Intelligent Photo Editing
如上,让图片转换回 code 有许多方法:

  • 方法一:z=argminzL(G(z),xT)z^*=arg\min_zL(G(z),x^T),使用梯度下降找到最合适的 zz^*
  • 方法二:使用 auto encoder ;
  • 方法三:方法一、二结合。

Editing Photos

【李宏毅2020 ML/DL】P81 Generative Adversarial Network | Intelligent Photo Editing
此外,如果我们为画面增加一笔(如上图红色笔画),Editing Photos 中 zz^* 该如何表示呢?这里有三个约束:

  • 这个 z 要满足与这一笔有关联;
  • 这个 z 与原图像的 z0z_0 不能太远;
  • 这个 zz 应该真实。

Image super resolution

【李宏毅2020 ML/DL】P81 Generative Adversarial Network | Intelligent Photo Editing
如上,使用 GAN 在细节处也能在绘制出清晰的图片。

相关文章:

  • 2022-01-20
  • 2021-04-11
  • 2021-07-03
  • 2021-09-06
  • 2021-06-24
  • 2021-07-27
  • 2021-10-11
  • 2021-05-22
猜你喜欢
  • 2021-07-20
  • 2021-05-16
  • 2021-04-08
  • 2021-05-08
  • 2021-10-01
  • 2021-12-06
  • 2021-11-13
相关资源
相似解决方案