【问题标题】:Interpreting how R codifies dummy response variable in Logistic Regression解释 R 如何在逻辑回归中编码虚拟响应变量
【发布时间】:2018-05-23 21:37:04
【问题描述】:

我是一个新手,在解释我的逻辑回归的输出时遇到了麻烦。 我的响应变量有两个值——“multiplex”和“subterraneus”。当在“microtus.train”数据帧上使用 factor() 函数时,我按该顺序得到“mutiplex and subterraneus”。在我拟合模型并预测响应后,我无法理解概率的含义。这些概率是否意味着观测是“地下”的概率?当我使用“对比(microtus.train$Group)”语句时,我得到了下表。

> contrasts(microtus.train$Group)
             subterraneus
multiplex               0
subterraneus            1

根据这张表,我解释说该模型试图预测“地下”的概率(而不是“多路复用”的概率),因为“1”被虚拟编码为“地下”。我的假设正确吗?

我的代码如下所示,提前感谢您的帮助。

library(Flury)
data(microtus, package = "Flury")

str(microtus)
summary(microtus)

# Creating training & test data frames
microtus.train <- subset(microtus, 
                     microtus$Group %in% c("multiplex", "subterraneus"), 
                     select = c("Group", "M1Left", "M2Left", "M3Left", 
                                "Foramen", "Pbone","Length", "Height",
                                "Rostrum") )

# Drop 3rd factor level
microtus.train$Group = droplevels(microtus.train$Group)
factor(microtus.train$Group)


nullModel.GLM <- glm(Group ~ 1, data = microtus.train, 
                     family = binomial())
fullModel.GLM <- glm(Group ~ ., data = microtus.train, 
                     family = binomial())
summary(nullModel.GLM)
summary(fullModel.GLM)

stepFwd.GLM <- step(nullModel.GLM, scope = list(upper = fullModel.GLM), 
                    direction = 'forward', k = 2)
stepFwd.GLM.fitResults <- predict(stepFwd.GLM, type = 'response')
stepFwd.GLM.fitResults

contrasts(microtus.train$Group)

【问题讨论】:

    标签: r logistic-regression


    【解决方案1】:

    重要的不是对比,而是因子水平的顺序(对比指定如何将 预测变量 变量编码为虚拟变量)。来自?glm

    对于“二项式”和“准二项式”族,响应还可以 被指定为“因素”(当第一级表示失败时 和所有其他人成功)

    由于 R 默认按字母顺序定义因子的级别,“multiplex”(可能)是第一个级别,“subterraneus”是第二个级别,因此逻辑回归预测的是“subterraneus”的概率。您可以使用levels(microtus$Group) 进行检查,并在必要时使用factor() 和明确设置的levels 参数进行调整。

    【讨论】:

    • 谢谢,本·博尔克。你真的帮了大忙!
    猜你喜欢
    • 2015-01-03
    • 2021-04-27
    • 2014-02-20
    • 2019-07-22
    • 2018-01-20
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-09-17
    相关资源
    最近更新 更多