
定义**函数sigmoid()
g(z)=sigmoid(z)=(1+e−z)−1
图中第2层为隐藏层,其各个神经元入下所示,
a1(2)=g(Θ10(1)x0+Θ11(1)x1+Θ12(1)x2+Θ13(1)x3)a2(2)=g(Θ20(1)x0+Θ21(1)x1+Θ22(1)x2+Θ23(1)x3)a3(2)=g(Θ30(1)x0+Θ31(1)x1+Θ32(1)x2+Θ33(1)x3)
将第2层神经元组成一个向量a(2)
a(2)=⎣⎢⎢⎢⎡a0(2)=1a1(2)a2(2)a3(2)⎦⎥⎥⎥⎤
将输入特征x,组成一组向量x,注意多了一个默认的x0=1
x=⎣⎢⎢⎡x0=1x1x2x3⎦⎥⎥⎤
将第j层后的权重系数,组成矩阵Θ(j),其维度是(第j+1层的元素数量)×(第j层的元素数量+1),其中的元素不包括偏置元素。例如下面的Θ(1),维度是3×4
Θ(1)=⎣⎢⎡Θ10(1)Θ20(1)Θ30(1)Θ11(1)Θ21(1)Θ31(1)Θ12(1)Θ22(1)Θ32(1)Θ13(1)Θ23(1)Θ33(1)⎦⎥⎤
以此类推,所以有入下公式,其中的1,为默认存在的偏置项。
a(2)=[1g(Θ(1)x)]
a(3)=[1g(Θ(2)a(2))]
y=g(Θ(3)a(3))
注意,只有在计算下一层时,才会给当前层添加一个隐藏的1,也就是说,a(2)有两个意思,一个是图中显示的
a(2)=⎣⎢⎡a1(2)a2(2)a3(2)⎦⎥⎤=g(Θ(1)x)
另一个意思是为了计算下一层神经元,添加的隐藏的偏置1。
a(2)=⎣⎢⎢⎢⎡a0(2)=1a1(2)a2(2)a3(2)⎦⎥⎥⎥⎤=[1g(Θ(1)x)]