R：估计模型方差答案

【问题标题】：R: Estimating model varianceR：估计模型方差
【发布时间】：2014-12-04 20:06:47
【问题描述】：

在 ROC 的演示中，有一些模型在绘制时具有传播，例如包含 10 个响应估计值的 hiv.svm$predictions。有人可以提醒我如何计算模型的 N 个估计值。我正在使用 RPART 和神经网络来估计单个输出（真/假）。如何对训练数据运行 10 次不同的采样以获得 10 种不同的模型对输入的响应。我觉得这个功能叫bootstraping，但是不知道怎么实现。

我需要在插入符号之外执行此操作，因为当我使用插入符号时，我不断收到消息“选项卡 [1：m，1：m] 中的错误：下标超出范围”。有没有“简单”的引导功能？

【问题讨论】：

您是否进行过任何搜索？
看cran.r-project.org/web/packages/bootstrap/bootstrap.pdf
对于树木，使用森林，参考stat.ethz.ch/pipermail/r-help/2007-September/140716.html
@BondedDust 我认为问题在于要预测的数据是罕见事件，即 7000 个样本中的 10 个事件。可能，当插入符号进行引导时，所有事件都丢失了，因此没有什么可预测的，并且输出向量全为零。
是的。我不是该软件包的用户，但您应该调查是否有 caret-mechanisms 用于对非事件案例进行欠采样。

标签： r model variance

【解决方案1】：

显然答案为时已晚，但您可以通过简单地重命名因子的级别来使用插入符号，因为如果您的二元响应类型为逻辑，插入符号将不起作用。例如：

factor(responseWithTrueFalseLevel,
       levels=c(TRUE,FALSE),
       labels=c("myTrueLevel","myFalseLevel"))

【讨论】：