【发布时间】:2020-11-20 16:58:32
【问题描述】:
我想评估一个计算器,该计算器通过计算基于大量输入变量的事件发生概率的估计百分比来预测事件(实际上它是关于具有风险因素和术后并发症的患者)。不幸的是,我对计算器的实际工作原理一无所知,只能查看输入/输出值。在输入了许多场景后,我最终得到了这样的 df:
risk <- runif(100, 0, 1)
event <- sample(c(0,1), 100, replace = TRUE)
test.df <- data.frame(risk, event)
风险描述预测的概率,事件描述并发症是否实际发生。
现在我想了解计算器在预测患者并发症方面的能力。
是否适合使用二项式 glm 并使用标度的 brier 分数对其进行评估?
library (stats)
library (DescTools)
mod <- glm(event ~ risk, family = binomial, data = test.df)
BrierScore(mod, scaled = TRUE)
从我的角度来看,也可以直接从 df 计算 Brier 分数和 Scaled Brier 分数,但我不确定这是否是正确的方法。
BS <- function(obs, pred) {
mean((obs - pred)^2)
}
Scaled_BS <- function(obs, pred) {
1 - (BS(obs, pred) / (mean(obs) * (1 - mean(obs))))
}
BS(event, risk)
Scaled_BS(event, risk)
如果这是一个完全错误的方法,请原谅我。我是这种任务的新手,任何帮助将不胜感激!
【问题讨论】: