【发布时间】:2022-01-23 08:34:40
【问题描述】:
我只是想知道来自 R 中 glmnet 包的 cv.glmnet 中的训练集和测试集的百分比是多少。我已经阅读了 glmnet 包的文档,并且没有包含有关训练集/测试集比例的信息。请告诉我是否遗漏了软件包文档中的某些内容。任何帮助将不胜感激。谢谢。
【问题讨论】:
我只是想知道来自 R 中 glmnet 包的 cv.glmnet 中的训练集和测试集的百分比是多少。我已经阅读了 glmnet 包的文档,并且没有包含有关训练集/测试集比例的信息。请告诉我是否遗漏了软件包文档中的某些内容。任何帮助将不胜感激。谢谢。
【问题讨论】:
?cv.glmnet 的帮助页面有两个部分可供查看:
参数nfolds
折叠数 - 默认为 10。虽然 nfolds 可以大到 样本量(留一法CV),不推荐大 数据集。允许的最小值是 nfolds=3
来自foldid 的值部分
如果 keep=TRUE,则使用折叠分配
即。在函数参数中设置keep=TRUE 以便之后访问折叠
该函数会将每一行放入 10 个大小大致相同的组/折叠中。然后它将运行模型的 10 次迭代,每次都留出其中一次进行测试。所以它的 90% 训练和 10% 测试但重复了 10 次。
如果您愿意,可以使用 foldid 参数提供自己的折叠。希望有帮助:)
【讨论】: