【发布时间】:2018-01-28 16:15:12
【问题描述】:
有人可以帮忙吗?
我正在使用 R 中的虚拟包(函数虚拟)将分类变量(10 个类别)转换为虚拟变量,因为我使用的一些算法(adaboost 和旋转森林)不能很好地处理分类变量。
使用该软件包后,我得到了 10 个虚拟变量,但它们是因素。我希望它们是带有 1 和 0 的数字。
我应该将它们转换为数字吗?或将它们用作因素。
非常感谢!!!! 一切顺利 佩德罗
【问题讨论】:
-
你用的是包的什么功能?如果它是函数
dummy,请参阅帮助页面中的参数int。 -
是否应该转换它们取决于:a) 您计划使用的函数的技术要求输入(adaboost 和旋转森林) b) 某些函数以不同方式处理因子和数值。因此,您必须确保不会通过将因子转换为数值来产生问题。
-
谢谢。我已经使用了函数 dummy。已将该信息添加到问题中。
-
谢谢瑞,我看到了。但是我应该选择哪个选项?是否取决于这些算法的要求?
-
是的。如果您正在使用包
fastAdaboost中的函数adaboost,那么响应应该是factor。
标签: r dummy-variable