1. Learning rate不合适,如果太大,会造成不收敛,如果太小,会造成收敛速度非常慢;

2. Batch size太大,陷入到局部最优;

3. 网络太简单,一般情况下,网络的层数和节点数量越大,拟合能力就越强,如果层数和节点不够多,无法拟合复杂的数据,也会造成不收敛.

相关文章:

  • 2022-12-23
  • 2021-07-30
  • 2021-11-08
  • 2022-01-04
  • 2021-08-29
  • 2021-10-19
  • 2021-11-04
猜你喜欢
  • 2021-07-05
  • 2021-09-25
  • 2021-05-14
  • 2021-06-23
  • 2021-09-16
  • 2021-08-06
相关资源
相似解决方案