转载自:https://www.jianshu.com/p/284581d9b189
最近看到一篇决策树的论文,其中说到了5-fold cross-validation和10-fold cross-validation,所以查找了一些资料了解一下他们是什么。
原理:
它将原始数据分成K组(K-Fold),将每个子集数据分别做一次验证集,其余的K-1组子集数据作为训练集,这样会得到K个模型。这K个模型分别在验证集中评估结果,最后的误差MSE(Mean Squared Error)加和平均就得到交叉验证误差。
一般情况下,我们验证时只会使用到5-fold cross-validation和10-fold cross-validation。