【发布时间】:2019-08-04 09:05:13
【问题描述】:
我使用包含 55 个变量的 171 个观察值的数据集,其中 35 个变量具有我想用 mouse 函数估算的 NA:
imp_Data <- mice(Data,m=5,maxit=50,meth='pmm',seed=500)
imp_Data$imp
现在,运行 5 次插补后,我不知道如何测试并确定 5 次插补中的哪一个最适合我的数据集。
检查我一次又一次地使用带有线性模型的with()函数和pool()函数的脚本:
fit <- with(imp_Data, lm(a ~ b + c + d + e))
combine <- pool(fit)
但我不明白这个线性模型需要什么以及它如何帮助我找到最佳插补运行。
谁能以简单的方式告诉我如何对 5 个插补进行测试/如何决定选择哪一个?
感谢您的帮助!
【问题讨论】:
标签: r missing-data imputation r-mice