机器学习：一句话讲清楚L0,L1,L2范数

这三种范数是机器学习中经常用到的公式，下面介绍一下自己对这个最精炼的理解以及使用技巧。

简介

L0：对一个包含n个元素的向量，计算非零元素的个数
L1：对一个包含n个元素的向量，计算各个元素绝对值之和

机器学习：一句话讲清楚L0,L1,L2范数

L2：对一个包含n个元素的向量，计算各个元素平方之和，再取平方根

机器学习：一句话讲清楚L0,L1,L2范数

形象化理解

L0 由于在np上的局限性，我们通常更多的使用L1和L2。
L1和L2都可以用在机器学习上用来添加在损失函数里，当成是对于模型反向传播时的一种惩罚措施，来使我们的模型按照我们的期望提高泛化能力或者稀疏特性。
采用数形结合的方法可以很好的理解L1和L2。
在多维空间中，L1我们可以想象成一种包含多个角的图形，每个角都处在一个维度所代表的坐标轴上，这也就造成了采用L1正则化，会使得我们最后的模型参数会有大部分为0值（因为处在坐标轴上），这也就形成了一个由模型参数构成的稀疏矩阵。
关于L2范数，由于其带有平方项，因此和L1不同，其在多维空间中的分布更像是类球体，比较圆滑，也就造成了最后模型优化后得到的参数往往都比较小，趋向于0，但是不等于0，这样的模型对于新输入的测试数据，不会因为某个特征的数值而使得最后的输出偏离过大，也就在一定程度上提高了模型的泛化能力。
L1和L2在二维空间（两个参数）中的形象化表示如下图：

机器学习：一句话讲清楚L0,L1,L2范数

相关文章：

2021-10-21
2021-04-15
2021-12-12
2021-10-16
2021-08-29
2021-06-10

猜你喜欢

2021-06-15
2021-07-07
2021-07-29
2022-12-23
2022-12-23
2021-12-22
2021-11-25

相关资源

下载 2023-02-26
下载 2023-01-06
下载 2021-06-30

相似解决方案

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode