【发布时间】:2015-12-19 21:24:26
【问题描述】:
不确定这是否适合回答这个问题,但有人告诉我 CrossValidated 不是。因此,所有这些问题都与 sklearn 相关,但如果您对逻辑回归大体上有所了解,我也很想听听。
1) 数据是否必须标准化(平均值为 0,标准偏差为 1)?
2)在sklearn中,我如何指定我想要什么样的正则化(L1 vs L2)?请注意,这与惩罚不同;惩罚是指分类错误,而不是对系数的惩罚。
3)我怎样才能用来做变量选择?即,类似于线性回归的套索。
4) 使用正则化时,如何优化正则化强度 C?有什么内置的,还是我必须自己处理?
举个例子可能最有帮助,但我希望能对这些问题提供任何见解。
这是我的起点:http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html
非常感谢您!
【问题讨论】:
标签: python scikit-learn classification logistic-regression