【发布时间】:2021-05-13 02:22:53
【问题描述】:
在一些帮助下,我对增强型和多重插补数据集执行了 LASSO 回归,以构建一个诊断模型,该模型可以使用大量预测变量来区分疾病 A 和疾病 B。
最终,我得到了下表,其中包含选定的变量(这些都是以是/否为结果的分类变量)及其系数:
| Predictor | mean regression coefficient |
|---|---|
| Intercept | 10.141 |
| var1 | 1.671 |
| Var2 | -1.971 |
| Var3 | -5.266 |
| Var4 | -2.244 |
| Var5 | 5.266 |
我的问题是:我如何使用上表来预测新患者(尚未用于建立 te 模型)是否患有疾病 A 或疾病 B。
我想到了以下几点:
截距 + (1.671 (var1) x 0 或 1) - (1.971 (var2) x 0 或 1) - (5.266 (var3) x 0 或 1) ..... + (5.266 (var5) x 0或 1) = X
患疾病 A 的概率(在数据集中编码为 1)= e^X / (1+ e^X)
但是这种方法正确吗?
我希望有人可以帮助我!
【问题讨论】:
标签: r coefficients lasso-regression