文章目录 学习率 优化器 随机梯度下降(SGD) 带动量的SGD Adagrad RMSprop Adam 鞍点情况下 学习率 优化器 随机梯度下降(SGD) 带动量的SGD Adagrad RMSprop Adam 鞍点情况下 SGD处于局部最优无法下降 相关文章: 2021-05-03 2021-07-27 2022-12-23 2021-12-03 2021-09-30 2021-12-03