【问题标题】:Variational Autoencoders: MSE vs BCE变分自动编码器:MSE 与 BCE
【发布时间】:2021-03-21 05:46:34
【问题描述】:

我正在使用变分自动编码器,我看到有些人使用 MSE 损失,有些人使用 BCE 损失,有谁知道其中一个是否比另一个更正确以及为什么?

据我了解,如果假设 VAE 的潜在空间向量遵循高斯分布,则应使用 MSE Loss。如果假设它遵循多项分布,则应使用 BCE。此外,BCE 偏向于 0.5。

有人可以澄清一下这个概念吗?我知道这与信息期望的变分下界项有关......

非常感谢!

【问题讨论】:

    标签: machine-learning deep-learning neural-network autoencoder loss-function


    【解决方案1】:

    简而言之:最大化预测为正态分布(多项分布)的模型的似然性相当于最小化 MSE(BCE)

    数学细节:

    The real reason you use MSE and cross-entropy loss functions

    DeepMind 有一个很棒的lecture on Modern Latent Variable Models(主要是关于变分自动编码器),你可以在那里了解你需要的一切

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2017-12-05
      • 2022-01-14
      • 1970-01-01
      • 2018-09-13
      • 2021-07-20
      • 1970-01-01
      • 2018-03-04
      • 1970-01-01
      相关资源
      最近更新 更多