deeplearning.ai 总结 - 如何计算神经网络各部分的shape

flyfish

标记方法采用deeplearning.ai的标记方法

deeplearning.ai 总结 - 如何计算神经网络各部分的shape
输入层（Input layer）
隐藏层（Hidden layer）
输出层（Output layer）。

上图中是两层神经网络，输出层不算。
输入矩阵X记为

a^{[0]}

，
隐藏层输出记为

a^{[1]}

。

a_{1}^{[1]}]

表示隐藏层第1个神经元，

a_{2}^{[1]}]

表示隐藏层第2个神经元。

隐藏层有4个神经元写成矩阵的形式是

a^{[1]} = [\begin{matrix} a_{1}^{[1]} \\ a_{2}^{[1]} \\ a_{3}^{[1]} \\ a_{4}^{[1]} \end{matrix}]

输出层记为

a^{[2]}

计算过程

z = w^{T} x + b

a = σ (z)

从输入层到隐藏层的计算

z_{1}^{[1]} = w_{1}^{[1] T} x + b_{1}^{[1]}, a_{1}^{[1]} = σ (z_{1}^{[1]})

z_{2}^{[1]} = w_{2}^{[1] T} x + b_{2}^{[1]}, a_{2}^{[1]} = σ (z_{2}^{[1]})

z_{3}^{[1]} = w_{3}^{[1] T} x + b_{3}^{[1]}, a_{3}^{[1]} = σ (z_{3}^{[1]})

z_{4}^{[1]} = w_{4}^{[1] T} x + b_{4}^{[1]}, a_{4}^{[1]} = σ (z_{4}^{[1]})

隐藏层到输出层的计算

z_{1}^{[2]} = w_{1}^{[2] T} a^{[1]} + b_{1}^{[2]}, a_{1}^{[2]} = σ (z_{1}^{[2]})

转换成矩阵计算

Z^{[1]} = W^{[1]} X + b^{[1]}

A^{[1]} = σ (Z^{[1]})

Z^{[2]} = W^{[2]} A^{[1]} + b^{[2]}

A^{[2]} = σ (Z^{[2]})

W^{[1]}

的维度是（4,3），4是隐藏层神经元个数，3是输入层特征数

b^{[1]}

的维度是（4,1），

W^{[2]}

的维度是（1,4），
1对应着输出层神经元个数，4对应着隐藏层神经元个数。

b^{[2]}

的维度是（1,1）。

多个样本使用矩阵

f o r i = 1 到 m

z^{[1] (i)} = W^{[1]} x^{(i)} + b^{[1]}

a^{[1] (i)} = σ (z^{[1] (i)})

z^{[2] (i)} = W^{[2]} a^{[1] (i)} + b^{[2]}

a^{[2] (i)} = σ (z^{[2] (i)})

矩阵方式是

Z^{[1]} = W^{[1]} X + b^{[1]}

A^{[1]} = σ (Z^{[1]})

Z^{[2]} = W^{[2]} A^{[1]} + b^{[2]}

A^{[2]} = σ (Z^{[2]})

行是神经元个数，列是样本数目m

Z^{[1]}

和

A^{[1]}

的维度是（4,m）

Z^{[2]}

和

A^{[2]}

的维度均为（1,m）。