【发布时间】:2019-09-05 19:50:17
【问题描述】:
我有一个 30660 x 1612 的训练矩阵,由 3 个密集的连续特征和剩余的稀疏二元特征组成。 #cases (1): 6132, #controls (0): 24528。
model.glmnet <- cv.glmnet(matrix.glmnet, factor(obs.dt[,iscase]), family='binomial', type.measure='class', nfolds=5)
plot(model.glmnet)
使用coef(model.glmnet, s='lambda.1se') 选择的系数,其中model.glmnet 是用type.measure='auc' 创建的,非常有意义!问题:为什么结果如此不同?关于可能导致这种情况的数据特征有什么想法吗?
【问题讨论】: