【发布时间】:2020-03-02 07:41:48
【问题描述】:
我正在使用 statsmodel 在 python 中做一个逻辑回归模型。由于我的很多专栏都是分类的,所以我使用“get_dummies”对它们进行了一次性编码。我的新数据框现在有更多带有 1 和 0 的列。 (例如,gender1、gender2、stats1、status2、status 3 等)。
使用这个新数据框,如何为我的逻辑回归设置“参考水平”?默认情况下,我如何知道我的参考水平设置在什么位置?
【问题讨论】:
-
什么是参考水平?你能举个例子吗?
-
就像你做逻辑回归一样,系数表示参考水平的大小。就像如果你有 2 个变量('Male'、'Female'、'unknown')并且如果你的参考水平是'Male',那么分配给'female'的系数是你预测的可能性,在参考到男性变量。我确定我没有完全正确地解释它,但我知道确实存在参考类别的想法。
标签: python scikit-learn regression logistic-regression statsmodels