解释来自 R 的 Logistic 回归的系数答案

【问题标题】：Interpreting coefficients from Logistic Regression from R解释来自 R 的 Logistic 回归的系数
【发布时间】：2016-02-09 11:54:13
【问题描述】：

全部，

我对一组分类变量和连续变量进行逻辑回归，并将二元事件作为因变量。

现在建模后，我观察到一组显示负号的分类变量，我认为这是为了理解如果该分类变量出现很多次，则因变量出现的概率很低。

但是当我看到该自变量的出现百分比时，我看到了相反的趋势。因此结果似乎与直觉相反。任何可能发生这种情况的原因。我尝试在下面用一个伪示例进行解释。

因变量 - E 预测： 1. 分类变量 - 具有 2 个级别 (0,1) 的 Cat1 2. 连续 Var - Con1 3. 分类变量 - Cat2 有 2 个级别 (0,1) 后期建模：说所有都是显着的，系数如下所示，第一类 - (-0.6) Con1- (0.3) Cat2 - (-0.4)

但是当我计算 Cat 1 上事件 E 的发生百分比时，我观察到当 Cat1 为 1 时发生的百分比很高，我认为这是违反直觉的。

请帮助理解这一点。

【问题讨论】：

【解决方案1】：

逻辑回归系数与事件概率的变化没有直接关系，而是对事件赔率变化的相对度量。 This article 详细推导了如何解释逻辑回归的系数。在您的上下文中，CAT1 的系数为 -0.6 意味着 p(E|CAT1 = 1)

【讨论】：