【问题标题】:R: Estimating model varianceR:估计模型方差
【发布时间】:2014-12-04 20:06:47
【问题描述】:

在 ROC 的演示中,有一些模型在绘制时具有传播,例如包含 10 个响应估计值的 hiv.svm$predictions。有人可以提醒我如何计算模型的 N 个估计值。我正在使用 RPART 和神经网络来估计单个输出(真/假)。如何对训练数据运行 10 次不同的采样以获得 10 种不同的模型对输入的响应。我觉得这个功能叫bootstraping,但是不知道怎么实现。

我需要在插入符号之外执行此操作,因为当我使用插入符号时,我不断收到消息“选项卡 [1:m,1:m] 中的错误:下标超出范围”。有没有“简单”的引导功能?

【问题讨论】:

  • 您是否进行过任何搜索?
  • 对于树木,使用森林,参考stat.ethz.ch/pipermail/r-help/2007-September/140716.html
  • @BondedDust 我认为问题在于要预测的数据是罕见事件,即 7000 个样本中的 10 个事件。可能,当插入符号进行引导时,所有事件都丢失了,因此没有什么可预测的,并且输出向量全为零。
  • 是的。我不是该软件包的用户,但您应该调查是否有 caret-mechanisms 用于对非事件案例进行欠采样。

标签: r model variance


【解决方案1】:

显然答案为时已晚,但您可以通过简单地重命名因子的级别来使用插入符号,因为如果您的二元响应类型为 逻辑,插入符号将不起作用。例如:

factor(responseWithTrueFalseLevel,
       levels=c(TRUE,FALSE),
       labels=c("myTrueLevel","myFalseLevel"))

【讨论】:

    猜你喜欢
    • 2020-06-20
    • 2021-01-11
    • 2017-02-14
    • 2016-04-07
    • 1970-01-01
    • 1970-01-01
    • 2018-03-29
    • 2017-10-24
    相关资源
    最近更新 更多