【发布时间】:2018-10-24 04:46:44
【问题描述】:
在一个热编码器中有一种叫做虚拟陷阱的东西,即当我们用 3 个类别对分类列进行编码时,例如 a、b 和 c,然后使用一个热编码器,我们会得到 3 个类别,例如列 a、b 和c 但是当我们使用 get_dummies 时,我们得到 2 列而不是 a,然后 b 从虚拟陷阱中保存。是一种暴露于虚拟陷阱的热编码,或者它会处理它。我对吗?哪一个是虚拟陷阱的保存?还是可以将两者与我们的删除列一起使用,我将数据集用于许多算法。
寻求帮助。提前致谢。
【问题讨论】:
标签: machine-learning deep-learning bigdata data-science