【发布时间】:2017-02-22 06:21:38
【问题描述】:
我正在使用 Random Forest 包调试代码,之前几乎没有 R 经验。
我已经到了执行predict.randomForest 时出现错误的地步:
训练数据中不存在新的因子水平。
搜索这个网站我找到了原因并明白我需要删除导致问题的记录。
如何隔离(找出)导致问题的列/行?
【问题讨论】:
-
首先检查预测变量矩阵中的哪些列是因子。您可以运行
str(X),其中X是您的训练数据中的预测变量矩阵。然后在您的测试数据中执行相同的操作,并查看输出以查看哪些具有不同的数量或级别集。 -
谢谢! RF 对象上有很多东西......你指的是哪个预测矩阵?以及如何检查每列是否是一个因素?
标签: r machine-learning random-forest categorical-data r-factor