如何计算 R 中子样本的 AUC答案

【问题标题】：How to calculate AUCs for subsamples in R如何计算 R 中子样本的 AUC
【发布时间】：2021-08-07 04:35:23
【问题描述】：

我设法为我的数据集计算了一个整体 AUC，但现在我有兴趣计算和比较我的数据集子样本的 AUC。关于如何在 R 中解决这个问题的任何想法？

请， IG

【问题讨论】：

标签： r prediction auc

【解决方案1】：

非常感谢@Jagge！我确实采用了二次抽样的方式，然后使用 pROC 为每个小数据集计算 AUC。出于某种原因，我想到我可以在分析中进行拆分——但这超出了我的能力:)

【讨论】：

【解决方案2】：

如果没有一些数据样本，很难为您提供帮助，但我们假设您有一个包含一些 id、一些预测和一些结果的数据框。

然后您可以使用 dplyr 对数据进行分组并对数据的子集执行计算。我使用包 pROC 来计算组的 auc。

d <- tibble::tibble(
  id = c(1,1,1,1,1,2,2,2,2,2),
  predicitons = runif(10),
  outcome = factor(c("yes", "no", "yes", "no", "no", "no", "yes", "no", "yes", "yes")))

d %>% 
  dplyr::group_by(id) %>% 
  dplyr::summarise(
    auc = as.numeric(pROC::auc(predictor = predicitons, response = outcome)))

祝你好运！

【讨论】：