【发布时间】:2021-08-07 04:35:23
【问题描述】:
我设法为我的数据集计算了一个整体 AUC,但现在我有兴趣计算和比较我的数据集子样本的 AUC。关于如何在 R 中解决这个问题的任何想法?
请, IG
【问题讨论】:
标签: r prediction auc
我设法为我的数据集计算了一个整体 AUC,但现在我有兴趣计算和比较我的数据集子样本的 AUC。关于如何在 R 中解决这个问题的任何想法?
请, IG
【问题讨论】:
标签: r prediction auc
非常感谢@Jagge! 我确实采用了二次抽样的方式,然后使用 pROC 为每个小数据集计算 AUC。出于某种原因,我想到我可以在分析中进行拆分——但这超出了我的能力:)
【讨论】:
如果没有一些数据样本,很难为您提供帮助,但我们假设您有一个包含一些 id、一些预测和一些结果的数据框。
然后您可以使用 dplyr 对数据进行分组并对数据的子集执行计算。我使用包 pROC 来计算组的 auc。
d <- tibble::tibble(
id = c(1,1,1,1,1,2,2,2,2,2),
predicitons = runif(10),
outcome = factor(c("yes", "no", "yes", "no", "no", "no", "yes", "no", "yes", "yes")))
d %>%
dplyr::group_by(id) %>%
dplyr::summarise(
auc = as.numeric(pROC::auc(predictor = predicitons, response = outcome)))
祝你好运!
【讨论】: