【问题标题】:Exclude more than one columns when build logistic regression model using glm [duplicate]使用glm构建逻辑回归模型时排除多个列[重复]
【发布时间】:2016-10-04 17:22:15
【问题描述】:

例如我的模型有这个代码

g = glm(Vote ~., -ID, data=train, family=binomial)

因此,-ID 不包括 ID 列。如果我想排除更多列,我该怎么办?我试过了

g = glm(Vote ~., -c(ID,YOB,ABC) , data=train, family=binomial)

这引发了错误。

【问题讨论】:

    标签: r regression logistic-regression glm


    【解决方案1】:

    ?formula 提到您可以使用- 删除术语。方法如下:

    glm(Vote ~. -ID, data = train, family = binomial)
    
    g = glm(Vote ~. - ID - YOB - ABC, data = train, family = binomial)
    

    好吧,我可以给你举个例子:

    > head(trees) ## this is R's built-in dataset
    
      Girth Height Volume
    1   8.3     70   10.3
    2   8.6     65   10.3
    3   8.8     63   10.2
    4  10.5     72   16.4
    5  10.7     81   18.8
    6  10.8     83   19.7
    

    现在我们建立一个模型,删除GirthHeight

    > lm(Volume ~. -Girth - Height, trees)
    
    Call:
    lm(formula = Volume ~ . - Girth - Height, data = trees)
    
    Coefficients:
    (Intercept)  
          30.17  
    

    现在您看到只估计了截距。

    【讨论】:

      【解决方案2】:

      尝试在数据参数中使用命名列的否定:

       glm(... , data=train[, -c( "ID", "YOB","ABC")], ...)
      

      【讨论】:

        猜你喜欢
        • 2018-08-11
        • 2014-06-08
        • 1970-01-01
        • 2020-08-06
        • 2014-06-20
        • 2020-01-12
        • 2021-05-20
        • 1970-01-01
        • 1970-01-01
        相关资源
        最近更新 更多