问题引入
实际问题中,往往数据的特征数量很大,要使用线性方法,使用一些多项式拟合这样的数据很困难。我们得想办法使用非线性的算法解决这些问题。
神经网络
下面是生物的神经元结构:
每个神经元有很多树突,用于接收外部信息;有一个轴突,用于网外传递信息。
我们可以按照这个模型将逻辑回归抽象成这样:
接收信息,通过处理(计算后)往后传递处理后的信息。注意这里的处理结果:
注意:
- 信息来自不同的节点,这些节点只提供,而的值体现的传递线上。每条线都有一个参数(也被叫作权重w),传递后接收的信息应该是
- 每一层都有一个,称为偏置单元(bias unit)。和之前一样,
神经网络……结构
- 神经网络可以有很多层次,其中第一层是我们的输入层,最后一层是输出层,中间的层被称为隐藏层。
- 除了输出层以外,每一层都有一个偏置单元,会往下一层的每个点连边,点值为1。
- 除了输入层以外,其它层的每个单元都需要运算。所以这些层也称为计算层。
神经网络……运算
- 我们将由一个具体神经元计算得出的结果称为**项,其中表示第层的第个**项
- 为第层到第层的参数矩阵,表示从第层的第个项到第层的第个项的参数
- 显然,如果第层有个项,第层有个项,那么为(第层有个偏置单元)
向量化这个计算过程: