【发布时间】:2015-03-31 00:31:03
【问题描述】:
我正在使用线性混合效应模型(使用 R 中 nlme 包中的 lme() 函数运行),它具有一个固定效应和一个随机截距项(以考虑不同的组)。该模型是一个三次多项式模型,指定如下(遵循以下建议):
M1 = lme(dv ~ poly(iv,3), data=dat, random= ~1|group, method="REML")
仅一些示例数据:
> dput(dat)
structure(list(group = structure(c(1L, 1L, 1L, 1L, 1L, 1L, 1L,
1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L,
1L, 1L, 1L, 1L, 1L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L,
2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L), .Label = c("1",
"2"), class = "factor"), iv = c(24L, 100L, 110L, 115L, 116L,
120L, 125L, 127L, 138L, 139L, 142L, 150L, 152L, 154L, 157L, 161L,
168L, 177L, 181L, 189L, 190L, 198L, 200L, 213L, 216L, 225L, 254L,
284L, 40L, 51L, 76L, 130L, 155L, 158L, 160L, 163L, 167L, 169L,
170L, 177L, 185L, 190L, 203L, 206L, 208L, 219L, 223L, 233L, 238L,
244L, 251L, 260L, 265L), dv = c(0L, 8L, 6L, 8L, 10L, 10L, 9L,
11L, 12L, 15L, 16L, 19L, 13L, 10L, 17L, 22L, 18L, 22L, 25L, 20L,
27L, 28L, 29L, 30L, 29L, 30L, 30L, 30L, 0L, 0L, 2L, 7L, 14L,
12L, 17L, 10L, 14L, 13L, 16L, 15L, 17L, 21L, 25L, 20L, 26L, 27L,
28L, 29L, 30L, 30L, 30L, 30L, 30L)), .Names = c("group", "iv",
"dv"), row.names = c(NA, -53L), class = "data.frame")
我现在想使用predict 函数绘制拟合值(iv 的值在数据集中不连续,因此我想改善拟合曲线的外观/平滑度)。
使用有关如何从简单 lme 模型(不带多项式)绘制预测值的在线示例(请参阅此处:Extract prediction band from lme fit 和 http://glmm.wikidot.com/faq),我可以绘制预测的“人口”平均值,用于不使用多项式的 lme以下代码:
#model without polynomials
dat$group = factor(dat$group)
M2 = lme(dv ~ iv, data=dat, random= ~1|group, method="REML")
#1.create new data frame with new values for predictors (where groups aren't accounted for)
range(dat$iv)
new.dat = data.frame(iv = seq(from =24, to =284, by=1))
#2. predict the mean population response
new.dat$pred = predict(M2, newdata=new.dat, level=0)
#3. create a design matrix
Designmat <- model.matrix(eval(eval(M2$call$fixed)[-2]), new.dat[-ncol(new.dat)])
#4. get standard error and CI for predictions
predvar <- diag(Designmat %*% M2$varFix %*% t(Designmat))
new.dat$SE <- sqrt(predvar)
new.dat$SE2 <- sqrt(predvar+M2$sigma^2)
# Create plot with different colours for grouping levels and plot predicted values for population mean
G1 = dat[dat$group==1, ]
G2 = dat[dat$group==2, ]
plot(G1$iv, G1$dv, xlab="iv", ylab="dv", ylim=c(0,30), xlim=c(0,350), pch=16, col=2)
points(G2$iv, G2$dv, xlab="", ylab="", ylim=c(0,30), xlim=c(0,350), pch=16, col=3)
F0 = new.dat$pred
I = order(new.dat$iv); eff = sort(new.dat$iv)
lines(eff, F0[I], lwd=2, type="l", ylab="", xlab="", col=1, xlim=c(0,30))
#lines(eff, F0[I] + 2 * new.dat$SE[I], lty = 2)
#lines(eff, F0[I] - 2 * new.dat$SE[I], lty = 2)
我想将此代码扩展为 1) 绘制组内预测线以及平均总体值,以及 2) 确定如何调整代码以绘制预测的“总体”和“组内”曲线具有多项式的 lme(即上面的模型 M1)。
获取组预测:我可以使用以下代码获得一组组的预测值,但我想为每个组绘制一条线,以及总体平均值,对于示例数据,我看不到如何提取两个组线的预测值?
new.dat = data.frame(iv = dat$iv, group=rep(c("1","2"),c(28,25)))
Pred = predict(M2, newdata=new.dat, level=0:1)
此外,如果您想预测比原始 iv 值数量更多的值(例如,在您有不规则数据的情况下),这也不起作用。由于行数不同,下面的内容显然不起作用,但我在语法上苦苦挣扎。
new.dat = data.frame(iv = seq(from =24, to =284, by=1), group=rep(c("1","2"),c(28,25)))
对于多项式模型:我不明白如何将 poly(iv,3) 合并到 new.dat 数据框中以输入预测函数。
任何关于如何实现这两个目标的建议都将不胜感激,因为我一直在努力解决这个问题,但并不高兴(如果可能的话,我宁愿使用基本图形而不是 ggplot)。谢谢!
【问题讨论】:
-
这是大错特错的(也不清楚你所说的“没用”是什么意思)。不要通过平方和立方项来构造简单的多项式项。请改用
poly(iv, 3)。 -
如果你用 xyplot(dv ~ iv|group, dat) 作图,很明显,高度显着的三次项是天花板效应的产物,因为你的 'dv' 最大值为 30。
-
像往常一样,@BondedDust 有统计模型和 R 的权威答案。我唯一的评论是阅读
help(nlme:::predict.lme)。在其中,您将了解如何获得每个组的预测。 -
通常使用双冒号或三冒号访问帮助文件不会获得好的结果。加载 pkg:nlme 会成功:
help(predict.lme)或不加载:help(predict.lme, pack=nlme) -
@ 粘合灰尘。感谢您的建议:多项式和 poly() 函数的使用或“不当使用”。非常有帮助,但上面的数据不是真实数据,仅提供示例以了解人们如何预测值。抱歉,如果它不是最好的示例数据并且我的问题不清楚,我已经进行了一些编辑以试图澄清我的问题。我仍然是 R 的相对初学者,所以请多多包涵! predict.lme 上的帮助文件并没有提供太多信息——那是我的第一站。再次感谢多项式建议。
标签: r predict mixed-models polynomials nlme