【发布时间】:2017-08-09 22:19:18
【问题描述】:
R_blogger 提供了以下代码,其中我的添加被注释掉了,因为它们不起作用;我正在寻找一种方法来保存迭代逻辑回归中的系数向量和 p 值,这样我就可以修剪那些一直得分不佳的变量。
predictions <- foreach(m=1:iterations,.combine=cbind) %do% {
training_positions <- sample(nrow(training2), size=floor((nrow(training2)/length_divisor)))
train_pos<-1:nrow(training2) %in% training_positions
glm_fit <- glm(default~. ,data=training2[train_pos,],family=binomial(logit),
type=response, control = list(maxit = 25))
predict(glm_fit,newdata=testing)
#pvalues <- summary(glm_fit)$coeff[-1,4] < 0.0001
#coeffs <- summary(glm_fit)$coeff[-1,3]
}
probs <- rowMeans(predictions)
我希望能够为类似于预测的系数和 p 值检索对象
【问题讨论】:
-
在
list中返回您感兴趣的所有内容并更改.combine参数。 -
为什么需要 p 值?通常,人们会查看变量重要性统计数据,以确定哪些变量在预测响应方面看起来最重要。 caret 包中已经有为此的罐头功能,我建议您看一下;它可以与诸如此类的袋装模型一起使用...
-
@Roland 如何更改组合参数?上面的文档是粗略的。谢谢
标签: r logistic-regression