【发布时间】:2022-01-07 18:54:19
【问题描述】:
我正在分析一个数据集,其中包含新生婴儿的体重和他们母亲的一些信息,包括分类变量“smoke”——母亲是否吸烟。
我做了一个 aov 测试,想在它的帮助下绘制 ANOVA 模型的诊断图。我希望得到四个图,包括“残差与因子水平”图。相反,我得到了一个“残差 vs 杠杆”图,就好像我的分类变量是一个数字一样。
您可以在这里找到数据集:https://drive.google.com/file/d/1VwiAHdYZF2BrGZZ875GGdkyamKMgxmGU/view?usp=sharing
其中变量“smoke”的值为 0(非吸烟者)和 1(吸烟者)。我使用 mutate 将其更改为适当的因子(其中包括奇偶校验),然后自行进行 aov 测试并尝试绘制结果,以验证假设。您可以在下面找到我的代码:
babies <- read.csv("babies.csv")
babies <- babies %>%
mutate(parity = factor(parity,
levels = c(0, 1),
labels = c("not firstborn", "firstborn"))) %>%
mutate(smoke = factor(smoke,
levels = c(0, 1),
labels = c("non smoker", "smoker")))
model6 <- aov(babies$bwt ~ babies$smoke)
par(mfrow = c(2,2))
plot(aov(babies$bwt ~ babies$smoke))
我在第四个情节中得到的结果是这样的:
我试图检查“烟雾”是否是我想要的一个因素,就像这样:
> head(babies$smoke)
[1] non smoker non smoker smoker non smoker smoker non smoker
Levels: non smoker smoker
既然“烟雾”是一个因素(据我所知)和一个分类变量,为什么按数字变量存在杠杆作用?如何解决这个问题并获得正确的情节?
提前感谢您的帮助!
【问题讨论】: