highway network 2015年的文章了,由于最近收到了推送,才去详细了解了一下,特意在此做个笔记。

highway network的思想很简单,作者受LSTM的启发,在普通的网络上加了两个门而已(一个叫 Transform gate,另一个叫Carry gate)。Highway network可以有效缓解层数特别深的网络在优化时出现的梯度消失问题,可以对1000多层的网络进行有效的优化。

1. 普通网络

highway network

其中,x是输入,y是输出,highway network是权重,H是线性变换函数后接**函数。

2. highway neywork

highway network

highway network

T 是 Transform gate,C是Carry gate。通常情况下,C可以用T表示,即highway network,那么:

highway network

T是一个数值范围是0~1的sigmoid函数:

highway network

极端情况下:

highway network

当T=0,输入x直接被传给输出y,这就是highway network的由来;

当T=1,就是一个普通的网路节点;

 

相关文章: