batch_size就是为了让模型根据每个batch,去计算梯度,太大太小都不行,这个对模型的拟合是非常非常重要的

 

training sample=2918时,batch_size = 256无论怎么训练,都无法拟合(或者应该shuffle?)

而设置成64的时候,虽然训练比较慢,但是最终的拟合结果很好

 

 

相关文章:

  • 2021-09-18
  • 2022-01-29
  • 2022-12-23
  • 2021-12-23
  • 2021-12-25
  • 2021-04-04
  • 2021-08-17
  • 2022-12-23
猜你喜欢
  • 2021-09-21
  • 2021-04-15
  • 2021-07-14
  • 2021-08-18
  • 2021-05-12
  • 2021-09-24
相关资源
相似解决方案