【问题标题】:different results based on type.measure argument in cv.glmnet基于 cv.glmnet 中 type.measure 参数的不同结果
【发布时间】:2019-09-05 19:50:17
【问题描述】:

我有一个 30660 x 1612 的训练矩阵,由 3 个密集的连续特征和剩余的稀疏二元特征组成。 #cases (1): 6132, #controls (0): 24528。

model.glmnet <- cv.glmnet(matrix.glmnet, factor(obs.dt[,iscase]), family='binomial', type.measure='class', nfolds=5)
plot(model.glmnet)

type.measure='class',我得到

type.measure='auc',我得到

使用coef(model.glmnet, s='lambda.1se') 选择的系数,其中model.glmnet 是用type.measure='auc' 创建的,非常有意义!问题:为什么结果如此不同?关于可能导致这种情况的数据特征有什么想法吗?

【问题讨论】:

    标签: r glmnet


    【解决方案1】:

    我也有类似的观察。即使在增加 nfolds 并在 set.seed() 中使用相同的种子之后,type.measure='auc' 和 type.measure='class' 的有效 lambda 也是不同的。

    【讨论】:

    • 您正在使用不同的指标来确定最佳 lambda 值;当然你会得到不同的结果。
    猜你喜欢
    • 2020-01-13
    • 2011-09-30
    • 2019-10-19
    • 1970-01-01
    • 2016-04-13
    • 2017-05-12
    • 2019-05-20
    • 1970-01-01
    • 2013-05-29
    相关资源
    最近更新 更多