机器学习基础__02__L1L2范数在机器学习中应用

1. 范数概念

范数是衡量某个向量空间（或矩阵）中的每个向量以长度或大小。
范数的一般化定义：对实数p>=1，范数定义如下
机器学习基础__02__L1L2范数在机器学习中应用

L1范数
当p=1时，是L1范数，其表示某个向量中所有元素绝对值的和，也叫“稀疏规则算子”。
机器学习基础__02__L1L2范数在机器学习中应用

稀疏的意思是可以让权重矩阵的一部分值等于0（如何做到？后面会讲），但是一些参数仍然会比较大。
L1范数可以实现稀疏性，参数稀疏有两个很好的作用：

特征选择：选择出与预测有关的特征，无关的特征参数为0
可解释性：可以看出哪些特征与预测相关

L2范数
当p=2时，是L2范数，表示某个向量中所有元素平方和再开根号，也就是欧几里得距离公式。
机器学习基础__02__L1L2范数在机器学习中应用
L2范数与L1不同，他不会让部分参数等于0，而是让每个参数都接近于0。
L2范数最广泛的应用是在损失函数中加入正则项，防止过拟合，提升模型的泛化能力。