【问题标题】:Which classes should (binary) factor variables for R package mlr have?R 包 mlr 的(二进制)因子变量应该有哪些类?
【发布时间】:2017-08-16 23:46:21
【问题描述】:

我想准备一个数据集以在mlr 包的Task 中使用它。二元因子自变量应该是类因子、逻辑、字符还是整数?是否可以将具有超过 2 个类的因子变量作为因子/字符,或者是否有集成在 mlr 中的模型需要例如mlr 不会自动进行转换的模型矩阵?对于这些情况,mlr 期望哪些类?

例如:

x1 <- factor(sample(0:1, size=10, replace = TRUE))
x2 <- factor(sample(letters[1:5], size=10, replace = TRUE))
y <- sample(c("yes", "no"), size=10, replace = TRUE)
library(mlr)
makeClassifTask(data = data.frame(y, x1, x2), target = "y", positive="yes")

【问题讨论】:

    标签: r machine-learning mlr


    【解决方案1】:

    是的。如果它是一个因素,它应该是一个因素。当然,您可以拥有两个以上的类,尽管并非所有学习者都支持两个以上的类(mlr 将负责确定学习者是否自动兼容)。 mlr 总是自动将任务中的所有内容转换为适合学习者,或者告诉您学习者和任务不兼容。

    您还可以使用函数listLearners()列出适合给定任务的学习者。

    【讨论】:

      猜你喜欢
      • 2011-02-17
      • 1970-01-01
      • 2018-10-07
      • 1970-01-01
      • 1970-01-01
      • 2017-03-23
      • 2021-01-22
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多