生成对抗网咯(GAN)是一类在无监督学习中使用的神经网络,其有助于解决按文本生成图像、提高图片分辨率、药物匹配、检索特定模式的图片等任务。生成对抗网络由lan Goodfellow 于2014年提出,最近几年非常热门,但是由于其存在训练困难、生成器与判别器的loss无法指示训练进程、生成样本缺乏多样性等问题,仍在需要研究解决,虽然已经有一些变体,这篇文章只写写初步理论,感兴趣可以点这里:
GAN原理
用一个例子来比喻,假设你想买块好表,但是从未买过表的你很可能难辨真假;买表的经验可以避免奸商欺骗。当你开始将大多数手表标记为假表(在被骗之后),卖家开始生产更逼真的山寨表。这种买家与卖家之间的互相博弈,就像GAN的原理:判别器网络(手表买家)和生成器网络(生产假表的卖家)。
想要学习生成器的分布,应该定义数据x的参数p_g,以及输入噪声变量p_z(z)的分布。然后G(z,0_d)将z从潜在空间Z映射到数据空间,D(x,0_d)输出单个标量—一个x来自真实数据而不是p_g的概率。
训练判别器以最大化正确标注实际数据和生成样本的概率。训练生成器用于最小化log(1-D(G(z)))。换句话说,尽量减少判别器得出正确答案的概率。
两张图片概括其原理:
将文本翻译成图像
研究表明,使用自然语言的描述属性生成相应的图像是可行的。文本转化成图像的方法可以说明生成模型模拟真实数据样本的性能。`
可以看到根据一段文本可以生成一张图片。药物匹配
有研究人员提出一种运用GAN进行药物匹配的方法。我们的目标是训练生成器,以尽可能准确地从一个药物数据库中对现有药物进行按病取药的操作。
经过训练后,可以使用生成器获得一种以前不可治愈的疾病的药方,并使用辨别器确定生成的药方是否治愈了特定的疾病。- 肿瘤分子生物学的应用
另有研究表明,产生一组按照参数定义的新抗癌分子的管道来预测具有抗癌作用的药物反应和化合物。
研究人员提出了一种基于现有生化数据的用于识别和生成新化合物的对抗自编码器(AAE)模型。
对抗编码器以药物浓度和指纹作为输入并使用生长抑制率数据进行训练(GI,显示治疗后癌细胞的数量减少情况)
经过训练,网络可以期望的分布中生成分子,并使用GI神经元作为输出化合物的微調器。
总结
生成对抗网络作为最近火热的人工智能技术,我们有必要关注它,了解它,我相信GAN其强大的特点能改变机器学习未来。