首先看交叉熵的公式:
重点在于二分类问题x取值只有两个:0 和1,因此只要把x=1和x=0的值代入公式即可:
这一步我当时没搞清楚,很多讲推导的人就直接写下来,完全没搞明白∑符号怎么就没了,其实是把x=1和x=0带入公式就是每个样本的所有可能取值的和。
由于p就是真实标签y,q是神经网络模型预测的概率值:进一步就可以得到:
由于标签y=0或者y=1,因此上面加号两边只有一项留下来
对所有样本求每个样本交叉熵的均值即可
相关文章:
首先看交叉熵的公式:
重点在于二分类问题x取值只有两个:0 和1,因此只要把x=1和x=0的值代入公式即可:
这一步我当时没搞清楚,很多讲推导的人就直接写下来,完全没搞明白∑符号怎么就没了,其实是把x=1和x=0带入公式就是每个样本的所有可能取值的和。
由于p就是真实标签y,q是神经网络模型预测的概率值:进一步就可以得到:
由于标签y=0或者y=1,因此上面加号两边只有一项留下来
对所有样本求每个样本交叉熵的均值即可
相关文章: