【发布时间】:2020-03-18 16:57:43
【问题描述】:
我正在研究 WGAN,并希望实现 WGAN-GP。
在其原始论文中,由于 1-Lipschitiz 约束,WGAN-GP 使用梯度惩罚来实现。但是像 Keras 这样的包可以将梯度范数剪裁为 1(根据定义,这相当于 1-Lipschitiz 约束),那么我们为什么还要费心惩罚梯度呢?我们为什么不直接剪掉渐变呢?
【问题讨论】:
标签: machine-learning gradient-descent generative-adversarial-network