【发布时间】:2020-05-24 05:23:43
【问题描述】:
我有两个特征,比如 F1 和 F2,它们的相关性约为 0.9。
当我构建模型时,我首先考虑了要纳入回归模型的所有特征。一旦我有了我的模型,我就在我的模型上运行 Lasso 回归,希望这将解决特征之间的任何共线性问题。但是,Lasso 回归在我的模型中同时保留了 F1 和 F2。
两个问题:
i) 如果 F1 和 F2 高度相关,但 Lasso 回归仍然保留了它们,这意味着什么?这是否意味着正则化在某些情况下不起作用?
ii) 如何调整我的模型或 Lasso 回归模型以在我的模型中剔除 F1 或 F2? (我使用sklearn.linear_model.LogisticRegression,并设置了惩罚='l1'或'elasticnet',尝试了非常大或非常小的C值,尝试了'liblinear'或'saga'求解器,并且l1_ratio = 1,但我仍然可以' t 从我的模型中踢出 F1 或 F2)
【问题讨论】:
标签: python scikit-learn logistic-regression lasso-regression regularized