【发布时间】:2021-11-26 16:50:18
【问题描述】:
我试图了解我应该在这里做什么。我已经应用了 lasso 和岭回归,找到了最佳 lambda 并重新拟合了模型。但我不明白在那之后我应该做什么。
问题:
"。对于糖尿病数据集(上传到 Moodle),我们希望使用 10 个特征(X 变量) 预测 prog (Y),即基线后一年疾病进展的定量评估。 变量 prog 是数据中的最后一列。在拟合岭回归和 LASSO 之前,不要 忘记对所有 X 变量进行标准化,以使它们具有相同的比例。 使用岭回归和 LASSO 预测 prog。在两个回归中,选择最优 lambda 使用交叉验证。最佳 lambda 将对应于最小 CV 误差。 为了获得最佳 lambda,重新拟合 ridge 和 LASSO 模型。使用 1000 个引导程序运行引导程序 复制以获得回归系数估计的标准误差 (SE)。 对于每个 bootstrap 复制,您必须重新调整 ridge 和 LASSO 模型并聚合 回归系数的估计。然后,回归系数的 SE 估计值将 自举估计的标准差。 "
【问题讨论】: