【问题标题】:来自 R 中 glmnet 包的 cv.glmnet 中的训练/测试集比例
【发布时间】:2022-01-23 08:34:40
【问题描述】:

我只是想知道来自 R 中 glmnet 包的 cv.glmnet 中的训练集和测试集的百分比是多少。我已经阅读了 glmnet 包的文档,并且没有包含有关训练集/测试集比例的信息。请告诉我是否遗漏了软件包文档中的某些内容。任何帮助将不胜感激。谢谢。

【问题讨论】:

    标签: r glmnet


    【解决方案1】:

    ?cv.glmnet 的帮助页面有两个部分可供查看:

    参数nfolds

    折叠数 - 默认为 10。虽然 nfolds 可以大到 样本量(留一法CV),不推荐大 数据集。允许的最小值是 nfolds=3

    来自foldid 部分

    如果 keep=TRUE,则使用折叠分配

    即。在函数参数中设置keep=TRUE 以便之后访问折叠

    该函数会将每一行放入 10 个大小大致相同的组/折叠中。然后它将运行模型的 10 次迭代,每次都留出其中一次进行测试。所以它的 90% 训练和 10% 测试但重复了 10 次。

    如果您愿意,可以使用 foldid 参数提供自己的折叠。希望有帮助:)

    【讨论】:

      猜你喜欢
      • 2016-06-13
      • 1970-01-01
      • 2012-05-30
      • 2020-12-10
      • 2015-06-01
      • 2018-04-22
      • 1970-01-01
      • 1970-01-01
      • 2021-03-18
      相关资源
      最近更新 更多