经验风险和结构风险

借用 Andrew Ng Machine Learning 公开课视频一张图,举个例子:

[机器学习] 概念解析:从经验风险、结构风险到代价函数、损失函数、目标函数

在上式中,记Size为XX,Price为YY,三种拟合的函数分别为f1(X)f_1(X)f2(X)f_2(X)f3(X)f_3(X)

经验风险

为了表示我们拟合的好坏,我们就用一个函数来度量拟合的程度,比如均方误差函数:
L(Y,f(X))=(Yf(X))2(1) L(Y,f(X)) = (Y-f(X))^2 \tag{1}
经验风险是模型关于训练集的平均损失,定义如下:
Remp=1Ni=1NL(y(i),f(x(i)))(2) R_{emp}=\frac{1}{N}\sum_{i=1}^{N}L(y^{(i)},f(x^{(i)})) \tag{2}
以(2)式和上图,可以得到 L(Y,f1(X))L(Y,f_1(X)) > L(Y,f3(X))L(Y,f_3(X)) > L(Y,f3(X))L(Y,f_3(X)),也就是经验风险 f1(X)f_1(X)>f2(X)f_2(X)>f3(X)f_3(X)。训练集样本代表已经获得的信息,作为已经知道的经验。经验风险最小,等价于模型对训练集样本拟合最贴切

极大似然估计(MLE)就是经验风险最小化的一个例子。

结构风险

结构风险其实就是过拟合的风险。原因来说的话就是模型太复杂了。显然对于结构风险来说,f1(X)f_1(X)<f2(X)f_2(X)<f3(X)f_3(X)结构风险最小化。这个时候就定义了一个函数 J(f)J(f),来度量模型的复杂度,也叫正则化(regularization) 。常用的有 L1L_1L2L_2 范数。


代价函数、损失函数、目标函数的定义

损失函数和代价函数

代价函数损失函数是一回事,表示样本水平上模型结果于训练样本的平均误差

比如吴恩达机器学习课程中,对于logistic回归的代价函数 (cost function),定义如下:
[机器学习] 概念解析:从经验风险、结构风险到代价函数、损失函数、目标函数
可以看到是平均误差。

目标函数

目标函数是最终需要优化的函数,是有约束条件下的损失函数的最小化。换句话说,包括经验损失和结构损失,可以表示为:
obj=loss+Ω obj=loss+\Omega
其中:

  • lossloss:损失函数或者代价函数
  • Ω\Omega:正则化项

目标函数的目的是最优化经验风险和结构风险,即:
min[1Ni=1NL(y(i),f(x(i)))+λJ(f)] min[\frac{1}{N}\sum_{i=1}^{N}L(y^{(i)},f(x^{(i)}))+\lambda J(f)]
比如吴恩达机器学习课程中,对logistic回归给出的目标函数为:
[机器学习] 概念解析:从经验风险、结构风险到代价函数、损失函数、目标函数

相关文章:

  • 2021-04-17
  • 2022-02-24
  • 2021-09-26
  • 2021-12-03
  • 2021-08-10
  • 2021-06-11
  • 2022-12-23
猜你喜欢
  • 2022-12-23
  • 2022-01-11
  • 2021-07-16
  • 2021-10-26
  • 2022-12-23
相关资源
相似解决方案