sigmoid和softmax函数的区别

sigmoid函数（也叫逻辑斯谛函数）：
　引用wiki百科的定义：

　　A logistic function or logistic curve is a common “S” shape (sigmoid curve).

　　其实逻辑斯谛函数也就是经常说的sigmoid函数，它的几何形状也就是一条sigmoid曲线。

sigmoid**函数(也叫logistic_activate)其作为**函数的时候为：

sigmoid中**函数a= sigmoid和softmax函数的区别

　　logistic曲线如下：
　　 sigmoid和softmax函数的区别

同样，我们贴一下wiki百科对softmax函数的定义：

softmax is a generalization of logistic function that “squashes”(maps) a K-dimensional vector z of arbitrary real values to a K-dimensional vector σ(z) of real values in the range (0, 1) that add up to 1.

　　这句话既表明了softmax函数与logistic函数的关系，也同时阐述了softmax函数的本质就是将一个K
维的任意实数向量压缩（映射）成另一个K

维的实数向量，其中向量中的每个元素取值都介于（0，1）之间。

　　softmax函数形式如下：
　　 sigmoid和softmax函数的区别

总结：sigmoid将一个real value映射到（0,1）的区间（当然也可以是（-1,1）），这样可以用来做二分类。
而softmax把一个k维的real value向量（a1,a2,a3,a4….）映射成一个（b1,b2,b3,b4….）其中bi是一个0-1的常数，然后可以根据bi的大小来进行多分类的任务，如取权重最大的一维。其每个输出的值都是>0，而其输出总和为1,这个跟sigmoid函数不同。

sigmoid和softmax函数的区别

参考博客：

神经网络四：Softmax以及与Sigmoid的关系

神经网络三：浅析神经网络backpropagation算法中的代价函数

参考后的小总结点：

1、Softmax 是神经网络中另一种输出层函数，计算输出层的值。主要用于神经网络最后一层，作为输出层进行多分类，是Logistic（sigmoid）二分类的推广。

2、要知道Softmax是否存在学习慢的问题，首先先定义Softmax的cost：

sigmoid和softmax函数的区别

若a趋于1时，C为0，反之，若a小，则C会大，所以该函数能作为代价函数。

看学习是否快慢，就要看偏导数：

sigmoid和softmax函数的区别是否小

---------------

转：https://blog.csdn.net/yangdashi888/article/details/56835633?utm_source=blogxgwz1