https://arxiv.org/abs/1606.03657
- 在CGAN中,生成器网络还有一个附加参数c,即G(z,c) 其中c是一个条件变量。
- 在CGAN中,c假设在语义上是已知的,例如标签,因此在 训练期间我们必须提供它。在InfoGAN中, 我们假设c不知
道,所以我们做的是为c提出一一个先验,并根据数据推断它, 即我们想找到后验p(c|x,z)
- InfoGAN所要达到的目标就是通过非监督学习得到可分解 的特征表示。使用GAN加上最大化生成的图片和输入编码 之间的互信息。
- 最大的好处就是可以不需要监督学习,而且不需要大量额 外的计算花销就能得到可解释的特征。
- InfoGAN的出发点,它试图利用z,寻找一个可解释的表达, 于是它将z进行了拆解,一-是噪声z,二是可解释的隐变量c,
而我们希望通过约束c与生成数据之间的关系, 可以使得c里 面包含有对数据的可解释的信息。
- 如对MNIST数据,c可以分为categorical latent code代来 表数字种类信息(0~9) ,以及continuous
latent code来表示倾斜度、 笔画粗细等等。