首先看交叉熵的公式:
二分类问题损失函数交叉熵的推导
重点在于二分类问题x取值只有两个:0 和1,因此只要把x=1和x=0的值代入公式即可
二分类问题损失函数交叉熵的推导
这一步我当时没搞清楚,很多讲推导的人就直接写下来,完全没搞明白∑符号怎么就没了,其实是把x=1和x=0带入公式就是每个样本的所有可能取值的和。
由于p就是真实标签y,q是神经网络模型预测的概率值:进一步就可以得到:
二分类问题损失函数交叉熵的推导
由于标签y=0或者y=1,因此上面加号两边只有一项留下来
对所有样本求每个样本交叉熵的均值即可

相关文章:

  • 2022-12-23
猜你喜欢
  • 2021-05-09
  • 2021-10-21
  • 2021-05-08
  • 2021-11-30
  • 2021-04-26
相关资源
相似解决方案