【问题标题】:Interpreting coefficients from Logistic Regression from R解释来自 R 的 Logistic 回归的系数
【发布时间】:2016-02-09 11:54:13
【问题描述】:

全部,

我对一组分类变量和连续变量进行逻辑回归,并将二元事件作为因变量。

现在建模后,我观察到一组显示负号的分类变量,我认为这是为了理解如果该分类变量出现很多次,则因变量出现的概率很低。

但是当我看到该自变量的出现百分比时,我看到了相反的趋势。因此结果似乎与直觉相反。任何可能发生这种情况的原因。我尝试在下面用一个伪示例进行解释。

因变量 - E 预测: 1. 分类变量 - 具有 2 个级别 (0,1) 的 Cat1 2. 连续 Var - Con1 3. 分类变量 - Cat2 有 2 个级别 (0,1) 后期建模: 说所有都是显着的,系数如下所示, 第一类 - (-0.6) Con1- (0.3) Cat2 - (-0.4)

但是当我计算 Cat 1 上事件 E 的发生百分比时,我观察到当 Cat1 为 1 时发生的百分比很高,我认为这是违反直觉的。

请帮助理解这一点。

【问题讨论】:

  • 截距值是多少?如果它足够高,-0.6 的 beta 系数仍然可能导致发生的概率很高。
  • 是-1.2,intercept也是负数,是不是进一步加深了分类变量的负性?

标签: statistics logistic-regression


【解决方案1】:

逻辑回归系数与事件概率的变化没有直接关系,而是对事件赔率变化的相对度量。 This article 详细推导了如何解释逻辑回归的系数。在您的上下文中,CAT1 的系数为 -0.6 意味着 p(E|CAT1 = 1)

【讨论】:

  • 感谢您的参考,我现在所理解的内容引起了共鸣并有据可查
猜你喜欢
  • 2013-05-17
  • 2013-10-08
  • 2020-09-12
  • 1970-01-01
  • 1970-01-01
  • 2019-10-11
  • 2017-12-08
  • 1970-01-01
相关资源
最近更新 更多