介绍
要理解最优解和损失函数,我们需要先弄明白什么是误差。
以简单线性回归为例,如下图所示,青色数据样本为真实值,直线上同一位置的红色样本点为预测值,它们之间的空间距离就是误差,即真实样本点与预测样本点之间的距离。那么,如果我们把直线上每一个样本点的误差相加求和,就可以得到一个模型的整体误差。
什么是最优解?
根据上面的说明,我们明白了整体误差的概念,但它只是某一个时刻的。如果我们再对图中直线进行平移或改变角度,各样本之间的距离就会发生变化,这样又可以得到新的整体误差值。
最终,经过次变化计算,我们能得到模型在个不同时刻的整体误差值。而其中整体误差值最小的时刻对应的模型,就是我们要找的“最优解”。这一时刻,也是直线拟合数据样本点效果最好的时刻。简而言之,“最优解”就是我们能找到的整体误差最小的模型。
什么是损失函数?
损失函数就是用来求解模型最优解的公式。
要求最优解,就得先定义一个Loss损失函数。对于线性回归来说,损失函数称为MSE(Mean Squared Error)平方均值误差,先求平方再求平均。其表达式为,表示总样本数,代表1到之间的任意一条样本,表示求每条样本真实值与预测值差的平方(即每个样本点误差/损失的平方),然后对所有结果进行加和,再除以样本总数,得到平均均值误差。