基于 cv.glmnet 中 type.measure 参数的不同结果答案

【问题标题】：different results based on type.measure argument in cv.glmnet基于 cv.glmnet 中 type.measure 参数的不同结果
【发布时间】：2019-09-05 19:50:17
【问题描述】：

我有一个 30660 x 1612 的训练矩阵，由 3 个密集的连续特征和剩余的稀疏二元特征组成。 #cases (1): 6132, #controls (0): 24528。

model.glmnet <- cv.glmnet(matrix.glmnet, factor(obs.dt[,iscase]), family='binomial', type.measure='class', nfolds=5)
plot(model.glmnet)

当type.measure='class'，我得到

当type.measure='auc'，我得到

使用coef(model.glmnet, s='lambda.1se') 选择的系数，其中model.glmnet 是用type.measure='auc' 创建的，非常有意义！问题：为什么结果如此不同？关于可能导致这种情况的数据特征有什么想法吗？

【问题讨论】：

标签： r glmnet

【解决方案1】：

我也有类似的观察。即使在增加 nfolds 并在 set.seed() 中使用相同的种子之后，type.measure='auc' 和 type.measure='class' 的有效 lambda 也是不同的。

【讨论】：

您正在使用不同的指标来确定最佳 lambda 值；当然你会得到不同的结果。