1 术语
1.1 泛化能力(generalization)
- 从这个模型, 推广到其他模型
- 如果这个网络的参数是高次方的, 会学到一些噪声样本(因为拟合数据的能力太强了), 那么他的泛化能力就很弱
1.2 [:3]这个array的index表示取array的前三个
2 动量(惯性, 前一个梯度的惯性)(前一个梯度和当前梯度进行平行四边形3333)
3 learning rate(刚开始设置大一些, 之后再搞的小一些)

相关文章:
-
2022-12-23
-
2021-12-05
-
2022-01-23
-
2021-10-08
-
2022-12-23
-
2022-12-23
-
2021-08-30
-
2022-12-23
猜你喜欢
-
2021-09-07
-
2022-01-20
-
2021-10-07
-
2022-01-19
-
2022-12-23
-
2021-11-11
-
2021-08-14
相关资源
-
下载
2023-01-29
-
下载
2021-11-03
-
下载
2023-01-28
-
下载
2023-01-24
-
下载
2023-01-13