【发布时间】:2021-03-21 05:46:34
【问题描述】:
我正在使用变分自动编码器,我看到有些人使用 MSE 损失,有些人使用 BCE 损失,有谁知道其中一个是否比另一个更正确以及为什么?
据我了解,如果假设 VAE 的潜在空间向量遵循高斯分布,则应使用 MSE Loss。如果假设它遵循多项分布,则应使用 BCE。此外,BCE 偏向于 0.5。
有人可以澄清一下这个概念吗?我知道这与信息期望的变分下界项有关......
非常感谢!
【问题讨论】:
标签: machine-learning deep-learning neural-network autoencoder loss-function