神经网络的前向传播和反向传播推导

神经网络的前向传播和反向传播推导
$x_{1}$ 和 $x_{2}$ 表示输入
$w_{ij}$ 表示权重
$b_{ij}$ 表示偏置
$\sigma_{i}$ 表示**函数，这里使用sigmoid**函数
$out$ 表示输出
$y$ 表示真实值
$\eta$ 表示学习率

前向传播
$h_{1}=w_{11}x_{1}+w_{13}x_{2}+b_{11}$ ， $\alpha_{1}=\sigma(h1)=\frac{1}{1+e^{-h1}}$

$h_{2}=w_{12}x_{1}+w_{14}x_{2}+b_{12}$ ， $\alpha_{2}=\sigma(h2)=\frac{1}{1+e^{-h2}}$

$z=w_{21}\alpha_{1}+w_{22}\alpha_{2}+b_{21}$ ， $out=\sigma(z)=\frac{1}{1+e^{-z}}$

损失函数

$E=\frac{1}{2}(out-y)^2$

反向传播
求导
$\bigtriangleup w_{21}=\frac{\partial E}{\partial w_{21}}=\frac{\partial E}{\partial out}\frac{{\partial out}}{\partial z}\frac{\partial z}{\partial w_{21}}=(out-y)\sigma(z)(1-\sigma(z))\alpha_{1}$

$\bigtriangleup w_{22}=\frac{\partial E}{\partial w_{22}}=\frac{\partial E}{\partial out}\frac{{\partial out}}{\partial z}\frac{\partial z}{\partial w_{22}}=(out-y)\sigma(z)(1-\sigma(z))\alpha_{2}$

$\bigtriangleup b_{21}=\frac{\partial E}{\partial b_{21}}=\frac{\partial E}{\partial out}\frac{{\partial out}}{\partial z}\frac{\partial z}{\partial b_{21}}=(out-y)\sigma(z)(1-\sigma(z))$

更新 $w_{21}、w_{22}、b_{21}$

$w_{21}=w_{21}-\eta \bigtriangleup w_{21}$

$w_{22}=w_{22}-\eta \bigtriangleup w_{22}$

$b_{21}=b_{21}-\eta \bigtriangleup b_{21}$

求导

$\bigtriangleup w_{12}=\frac{\partial \alpha_{2}}{\partial h_{2}}\frac{{\partial h_{2}}}{\partial w_{12}}=\sigma(h_{2})(1-\sigma(h_{2}))x_{1}$

$\bigtriangleup w_{14}=\frac{\partial \alpha_{2}}{\partial h_{2}}\frac{{\partial h_{2}}}{\partial w_{14}}=\sigma(h_{2})(1-\sigma(h_{2}))x_{2}$

$\bigtriangleup b_{12}=\frac{\partial \alpha_{2}}{\partial h_{2}}\frac{{\partial h_{2}}}{\partial b_{12}}=\sigma(h_{2})(1-\sigma(h_{2}))$

$\bigtriangleup w_{11}=\frac{\partial \alpha_{1}}{\partial h_{1}}\frac{{\partial h_{1}}}{\partial w_{11}}=\sigma(h_{1})(1-\sigma(h_{1}))x_{1}$

$\bigtriangleup w_{13}=\frac{\partial \alpha_{1}}{\partial h_{1}}\frac{{\partial h_{1}}}{\partial w_{13}}=\sigma(h_{1})(1-\sigma(h_{1}))x_{2}$

$\bigtriangleup b_{11}=\frac{\partial \alpha_{1}}{\partial h_{1}}\frac{{\partial h_{1}}}{\partial b_{11}}=\sigma(h_{1})(1-\sigma(h_{1}))$

更新 $w_{12}、w_{14}、b_{12}$

$w_{12}=w_{12}-\eta \bigtriangleup w_{12}$

$w_{14}=w_{14}-\eta \bigtriangleup w_{14}$

$b_{12}=b_{12}-\eta \bigtriangleup b_{12}$

更新 $w_{11}、w_{13}、b_{11}$

$w_{11}=w_{11}-\eta \bigtriangleup w_{11}$

$w_{13}=w_{13}-\eta \bigtriangleup w_{13}$

$b_{11}=b_{11}-\eta \bigtriangleup b_{11}$