Swish是Google17年在10月16号提出的一种新型**函数,其原始公式为:f(x)=x * sigmod(x),变形Swish-B**函数的公式则为f(x)=x * sigmod(b * x),其拥有不饱和,光滑,非单调性的特征。

f(x)=x⋅sigmoid(βx)

β是个常数或可训练的参数.Swish 具备无上界有下界、平滑、非单调的特性。Swish 在深层模型上的效果优于 ReLU。例如,仅仅使用 Swish 单元替换 ReLU 就能把 Mobile NASNetA 在 ImageNet 上的 top-1 分类准确率提高 0.9%,Inception-ResNet-v 的分类准确率提高 0.6%。
当β = 0时,Swish变为线性函数f(x)=x2f(x)=x2.
β → ∞, σ(x)=(1+exp(−x))−1σ(x)=(1+exp⁡(−x))−1为0或1. Swish变为ReLU: f(x)=2max(0,x)

所以Swish函数可以看做是介于线性函数与ReLU函数之间的平滑函数.
谷歌swish**函数

相关文章:

  • 2022-01-14
  • 2022-12-23
  • 2022-12-23
  • 2022-12-23
  • 2021-12-29
  • 2021-04-21
  • 2022-12-23
  • 2021-12-10
猜你喜欢
  • 2021-10-18
  • 2021-06-21
  • 2021-11-24
  • 2022-12-23
  • 2021-06-18
  • 2022-12-23
相关资源
相似解决方案