【发布时间】:2020-11-27 22:25:45
【问题描述】:
-
在构建模型之前是否需要对分类变量进行缩放? 我已经使用 StandardScalear 缩放了我所有的连续数值变量 现在所有的 continue 变量都在 -1 和 1 之间,因为分类列是二进制的。
-
它将如何影响我的模型?
-
有人可以解释一下,缩放的分类变量将如何影响决策树分类器中的节点拆分
【问题讨论】:
-
这取决于您为分类变量使用的编码以及您使用的决策树实现,例如roamanalytics.com/2016/10/28/…。此外,对于基于树的模型,无需缩放连续变量。
-
谢谢@Dan,这真的很有帮助
标签: python pandas normalization