【发布时间】:2016-02-09 11:54:13
【问题描述】:
全部,
我对一组分类变量和连续变量进行逻辑回归,并将二元事件作为因变量。
现在建模后,我观察到一组显示负号的分类变量,我认为这是为了理解如果该分类变量出现很多次,则因变量出现的概率很低。
但是当我看到该自变量的出现百分比时,我看到了相反的趋势。因此结果似乎与直觉相反。任何可能发生这种情况的原因。我尝试在下面用一个伪示例进行解释。
因变量 - E 预测: 1. 分类变量 - 具有 2 个级别 (0,1) 的 Cat1 2. 连续 Var - Con1 3. 分类变量 - Cat2 有 2 个级别 (0,1) 后期建模: 说所有都是显着的,系数如下所示, 第一类 - (-0.6) Con1- (0.3) Cat2 - (-0.4)
但是当我计算 Cat 1 上事件 E 的发生百分比时,我观察到当 Cat1 为 1 时发生的百分比很高,我认为这是违反直觉的。
请帮助理解这一点。
【问题讨论】:
-
截距值是多少?如果它足够高,-0.6 的 beta 系数仍然可能导致发生的概率很高。
-
是-1.2,intercept也是负数,是不是进一步加深了分类变量的负性?
标签: statistics logistic-regression