思路

将训练数据集划分N个互斥子集,每次用其中一个子集当作验证集,剩下的N-1个作为训练集,进行N次训练和测试,得到N个结果。

代码

交叉验证(python)

参数说明:

n_splits:表示划分几等份

shuffle:在每次划分时,是否进行洗牌

①若为Falses时,其效果等同于random_state等于整数,每次划分的结果相同

②若为True时,每次划分的结果都不一样,表示经过洗牌,随机取样的

random_state:随机种子数

属性:

①get_n_splits(X=None, y=None, groups=None):获取参数n_splits的值

②split(X, y=None, groups=None):将数据集划分成训练集和测试集,返回索引生成器

通过一个不能均等划分的栗子,设置不同参数值,观察其结果

①设置shuffle=False,运行两次,发现两次结果相同

Reference

https://blog.csdn.net/kancy110/article/details/74910185

相关文章: