wxl845235800

商业股票数据

线性回归

岭回归:

使用二范数:

适合少样本稀疏数据,保留每个样本属性。

分类和回归树:

 

信息增益

每次树分节点时,样本是有放回采样

 

xgboost:extreme极度,求导时残差有泰勒展开。

GBDT:极度梯度决策树,残差方向求导。

过拟合的原因:

正常情况,训练集和测试集都应下降

但是训练集下降,测试集会反而上升。

 

设置早停机制,early stop防止过拟合。

 

分类:

技术点:

相关文章: