相比 L 2 正则化,L 1 正则化会产生更 稀疏(sparse)的解。此处稀疏性指的是最优值中的一些参数为 0。和 L 2 正则化相比,L 1 正则化的稀疏性具有本质的不同。
L 2 正则化不会使参数变得稀疏,而L 1 正则化有可能通过足够大的 α 实现稀疏。
相比 L 2 正则化,L 1 正则化会产生更 稀疏(sparse)的解。此处稀疏性指的是最优值中的一些参数为 0。和 L 2 正则化相比,L 1 正则化的稀疏性具有本质的不同。
L 2 正则化不会使参数变得稀疏,而L 1 正则化有可能通过足够大的 α 实现稀疏。
相关文章: