【发布时间】:2021-12-27 22:28:55
【问题描述】:
我想看看蝙蝠叫声的次数和幼犬饲养季节的时间之间是否存在关系。 pup 变量具有三个类别:“Pre”、“Middle”和“Post”。当我要求总结时,它只包括了产前和产后的 p 值。我在下面创建了一个示例数据集。使用示例数据集,我只是得到一个错误....使用我的实际数据集,我得到了上面描述的输出。
样本数据集:
Calls<- c("55","60","180","160","110","50")
Pup<-c("Pre","Middle","Post","Post","Middle","Pre")
q<-data.frame(Calls, Pup)
q
q1<-lm(Calls~Pup, data=q)
summary(q1)
来自示例的输出和错误消息:
> Calls Pup
1 55 Pre
2 60 Middle
3 180 Post
4 160 Post
5 110 Middle
6 50 Pre
Error in as.character.factor(x) : malformed factor
In addition: Warning message:
In Ops.factor(r, 2) : ‘^’ not meaningful for factors
我的分析的实际输入:
> pupint <- lm(Calls ~ Pup, data = park2)
summary(pupint)
这是我从我的实际数据集中得到的输出:
Residuals:
Min 1Q Median 3Q Max
-66.40 -37.63 -26.02 -5.39 299.93
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 66.54 35.82 1.858 0.0734 .
PupPost -51.98 48.50 -1.072 0.2927
PupPre -26.47 39.86 -0.664 0.5118
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 80.1 on 29 degrees of freedom
Multiple R-squared: 0.03822, Adjusted R-squared: -0.02811
F-statistic: 0.5762 on 2 and 29 DF, p-value: 0.5683
总的来说,只是想知道为什么上面的输出没有显示“中间”。抱歉,我的示例数据集的结果不一样,但也许该错误消息将有助于更好地理解问题。
【问题讨论】:
-
对于许多类型的回归,您会将分类变量编码为虚拟变量,并最终得到比类别数量少 1 个变量。在您的情况下, Middle 是基线 sthda.com/english/articles/40-regression-analysis/…
标签: r missing-data p-value