【发布时间】:2020-01-25 05:27:34
【问题描述】:
在运行逻辑回归时,这里有很多关于 statsmodels 中的"Perfect Separation Error" 的帖子。但我不是在做逻辑回归。我正在使用频率权重和高斯分布进行 GLM。所以基本上是 OLS。
我所有的自变量都是分类的,有很多类别。如此高维的二进制编码特征集。
但我经常从 statsmodels 中得到“perfectseperationerror”
我正在运行许多模型。我认为当我的数据对于这么多变量来说太薄时,我会收到此错误。但是,理论上,使用频率权重,我实际上拥有比数据框更多的特征,因为观察值应该乘以频率。
关于如何进行的任何指导?
reg = sm.GLM(dep, Indies, freq_weights = freq)
<p>Error: class 'statsmodels.tools.sm_exceptions.PerfectSeparationError'>
【问题讨论】:
标签: python-3.x statsmodels glm