training and test sets

Google机器学习课程笔记(2)

 

降低过拟合的发生:分成三个子集

Google机器学习课程笔记(2)

 

验证集评估训练集的效果,通过后再使用测试集评估检查

Google机器学习课程笔记(2)

 

特征工程:原始数据---》特征矢量

Google机器学习课程笔记(2)

 

缩放特征值(转换为标准范围(0,1),(-1,1))

Google机器学习课程笔记(2)

处理极端离群值:

取对数

Google机器学习课程笔记(2)

最大值限制(伪影)

 

分箱:分成多个不同的布尔值特征

Google机器学习课程笔记(2)

 

特征组合:Google机器学习课程笔记(2)

组合独热矢量

线性学习器可以很好地扩展到大量数据。对大规模数据集使用特征组合是学习高度复杂模型的一种有效策略。神经网络可提供另一种策略

 

相关文章:

  • 2022-02-28
  • 2021-11-20
  • 2021-07-30
  • 2021-07-31
  • 2021-04-11
  • 2021-12-23
  • 2021-12-06
  • 2021-04-16
猜你喜欢
  • 2021-10-22
  • 2022-01-21
  • 2021-10-30
  • 2021-11-13
  • 2021-04-05
  • 2021-11-10
  • 2021-06-23
相关资源
相似解决方案