training and test sets
降低过拟合的发生:分成三个子集
验证集评估训练集的效果,通过后再使用测试集评估检查
特征工程:原始数据---》特征矢量
缩放特征值(转换为标准范围(0,1),(-1,1))
处理极端离群值:
取对数
最大值限制(伪影)
分箱:分成多个不同的布尔值特征
特征组合:
组合独热矢量
线性学习器可以很好地扩展到大量数据。对大规模数据集使用特征组合是学习高度复杂模型的一种有效策略。神经网络可提供另一种策略
training and test sets
降低过拟合的发生:分成三个子集
验证集评估训练集的效果,通过后再使用测试集评估检查
特征工程:原始数据---》特征矢量
缩放特征值(转换为标准范围(0,1),(-1,1))
处理极端离群值:
取对数
最大值限制(伪影)
分箱:分成多个不同的布尔值特征
特征组合:
组合独热矢量
线性学习器可以很好地扩展到大量数据。对大规模数据集使用特征组合是学习高度复杂模型的一种有效策略。神经网络可提供另一种策略
相关文章: