【发布时间】:2013-11-05 10:48:00
【问题描述】:
我有一个数据集,为了简单起见,假设它有 1000 个样本(每个都是一个向量)。
我想分割我的数据进行交叉验证,训练和测试,不是随机的1,例如,如果我想要 4 折交叉验证,我应该得到:
fold1:火车 = 1:250;测试= 251:1000
fold2:train = 251:500, test = [1:250 ; 501:1000]
fold3:训练 = 501:750,测试 = [1:500; 751:1000]
fold4:训练 = 751:1000,测试 = 1:750
我知道CVPARTITION,但 AFAIK - 它随机拆分数据 - 这不是我需要的。
我想我可以为它编写代码,但我想可能有一个我可以使用的函数。
(1) 数据已经打乱了,我需要能够轻松地重现实验。
【问题讨论】:
-
我假设你知道这一点,但如果唯一的目标是完全可重复的工作,我建议在随机化样本之前设置
rng来初始化你的随机生成器。
标签: matlab statistics cross-validation