【问题标题】:Dummy Package in RR中的虚拟包
【发布时间】:2018-01-28 16:15:12
【问题描述】:

有人可以帮忙吗?

我正在使用 R 中的虚拟包(函数虚拟)将分类变量(10 个类别)转换为虚拟变量,因为我使用的一些算法(adaboost 和旋转森林)不能很好地处理分类变量。

使用该软件包后,我得到了 10 个虚拟变量,但它们是因素。我希望它们是带有 1 和 0 的数字。

我应该将它们转换为数字吗?或将它们用作因素。

非常感谢!!!! 一切顺利 佩德罗

【问题讨论】:

  • 你用的是包的什么功能?如果它是函数dummy,请参阅帮助页面中的参数int
  • 是否应该转换它们取决于:a) 您计划使用的函数的技术要求输入(adaboost 和旋转森林) b) 某些函数以不同方式处理因子和数值。因此,您必须确保不会通过将因子转换为数值来产生问题。
  • 谢谢。我已经使用了函数 dummy。已将该信息添加到问题中。
  • 谢谢瑞,我看到了。但是我应该选择哪个选项?是否取决于这些算法的要求?
  • 是的。如果您正在使用包 fastAdaboost 中的函数 adaboost,那么响应应该是 factor

标签: r dummy-variable


【解决方案1】:

执行一次热编码后,将它们保持为 factor 或 numeric 没有区别。最好不要对基于树的模型执行一次热编码。它会降低性能。Here is an article describing effect of one hotted variables.。最好通过将分类变量转换为因子来传递它们

【讨论】:

    猜你喜欢
    • 2014-08-08
    • 2015-10-23
    • 1970-01-01
    • 1970-01-01
    • 2016-12-08
    • 2018-01-20
    • 2018-10-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多