【发布时间】:2020-11-25 12:12:15
【问题描述】:
我使用 R 中的 randomForest 包使用训练集训练随机森林模型。训练集中的变量是字符类,我将其转换为 as.numeric(factor())。
但是,测试集中的同一个变量仍然是字符。但我惊讶地发现,我仍然可以从我训练的随机森林模型中得到预测,即使那个变量是一个字符类。而且我还发现,如果我把测试集中的那个变量也转换成as.numeric(factor()),那么在测试集上的表现就不一样了。
那么有谁知道 R 解释和随机森林模型如何读取和处理测试集中的字符变量,而训练集中的相同变量不是字符类?
提前致谢!!
【问题讨论】:
标签: class character random-forest training-data test-data