【发布时间】:2013-06-05 21:28:16
【问题描述】:
我正在使用 R 中引导库的 cv.glm 交叉验证程序测试逻辑回归的性能。
我的一些预测变量是因子。
当我运行它时,我收到以下错误消息:
Error in model.frame.default(Terms, newdata, na.action = na.action, xlev = object$xlevels)
factor color has new levels RED
我想我理解这个问题。可能是我在不存在某些水平的因子变量的观察子集上训练回归模型。如果这个模型后来被用于新的观察,包括预测变量的看不见的水平,那么它不知道如何表现。
因为这在我看来像是一个基本的 CV 问题,我很惊讶我没有在库文档中找到任何提及。
我将不胜感激任何指针。
【问题讨论】:
-
感谢您的评论。为了清楚起见,您建议使用 ipred 包而不是引导库来进行错误估计?
标签: r cross-validation logistics