【发布时间】:2013-06-19 11:38:37
【问题描述】:
我已经在 R 中使用随机森林进行分类,其中相关列具有分类值(例如 0 或 1)。例如,对于鸢尾花数据库,我们可以使用随机森林根据物种对数据进行分类,如下所示:
myRF <- randomForest(Species ~ ., data=iris, importance=TRUE,proximity=TRUE)
这是有道理的,因为 Species 只能采用几个分类值。问题是 Species 是否可以取 1 到 100 之间的值,我想将数据分为两类:值大于 50 的值和值小于 50 的值?
当然,我可以根据 Species 添加另一个值为 1 或 0 的列,然后我对最后一列而不是 Species 进行分类,但是有没有办法直接告诉 R 我们要对数据进行分类分为 2 类:物种小于 50 的类别和大于 50 的类别? (假设物种的新假设值)?
谢谢
【问题讨论】:
标签: r classification random-forest