Deep learning II - I Practical aspects of deep learning - Regularizing your neural network 神经网络范数正则化

Regularizing your neural network 神经网络正则化

Logistic regression regularization

先用简单的逻辑回归正则化作为例子，因为神经网络的参数 $W$ 是2维的。

无正则
$J (w, b) = \frac{1}{m} \sum_{i = 1}^{m} L ({\hat{y}}^{(i)} - y^{(i)})$
$L_{2}$ 正则
$J (w, b) = \frac{1}{m} \sum_{i = 1}^{m} L ({\hat{y}}^{(i)} - y^{(i)}) + \frac{λ}{2 m} | | w | |_{2}^{2}$
$| | w | |_{2}^{2} = \sum_{j = 1}^{n_{x}} w_{j}^{2} = w^{T} w$
$L_{1}$ 正则
$J (w, b) = \frac{1}{m} \sum_{i = 1}^{m} L ({\hat{y}}^{(i)} - y^{(i)}) + \frac{λ}{m} | | w | |_{1}$

| | w | |_{1} = \sum_{j = 1}^{n_{x}} | w |_{j}

Neural network regularization

Frobenius正则(类似 $L_{2}$ 正则)
$J (w^{[1]}, b^{[1]}, \dots, w^{[l]}, b^{[l]}) = \frac{1}{m} \sum_{i = 1}^{m} L ({\hat{y}}^{(i)}, y^{(i)}) + \frac{1}{2 m} \sum_{l = 1}^{L} | | w^{[l]} | |_{F}^{2}$
$| | w^{[l]} | |_{F}^{2} = \sum_{i = 1}^{n^{[l]}} \sum_{j = 1}^{n^{[l - 1]}} (w_{i j}^{[l]})^{2}$

相较于无正则化的反向传播，正则化的反向传播在更新 $W$ 时，会对其进行权重衰减（weight decay），并下降。

d w^{[l]} = (f r o m b a c k p r o p a g a t i o n) + \frac{λ}{m} w^{[l]}

\begin{aligned} w^{[l]} : & = w^{[l]} - α d w^{[l]} \\ = w^{[l]} - α \frac{λ}{m} w^{[l]} - α (f r o m b a c k p r o p a g a t i o n) \\ = (1 - α \frac{λ}{m}) w^{[l]} - α (f r o m b a c k p r o p a g a t i o n) \end{aligned}

Deep learning II - I Practical aspects of deep learning - Regularizing your neural network 神经网络范数正则化

相关文章：

2021-04-30
2021-10-16
2022-01-04
2022-01-07
2022-12-23
2021-12-04
2022-03-09

猜你喜欢

2021-05-14
2021-07-16
2022-01-04
2021-06-04
2021-05-06
2021-10-29
2021-05-29

相关资源

下载 2023-01-29
下载 2023-04-10
下载 2022-12-11

相似解决方案

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode