【发布时间】:2012-10-12 16:16:53
【问题描述】:
我不太明白这个输出中的 p 值是什么意思。我不是指这样的 p 值,而是在这种情况下。
> Model 1: sl ~ le + ky
> Model 2: sl ~ le
Res.Df RSS Df Sum of Sq F Pr(>F)
1 97 0.51113
2 98 0.51211 -1 -0.00097796 0.1856 0.6676
我得到了类似的东西,现在我想知道哪种型号更合适。 由于只有一个而不是两个 p 值,我感到困惑。 我使用 summary(model1) 或 summary(model2) 得到不同的 pvalue
现在如果
> fm2<-lm(Y~X+T)
(T 是我的指标变量)和
> fm4<-lm(Y~X)
如果我这样做了
> anova(fm2,fm4)
这测试了原假设H0: alpha1==alpha2
(Ha: alpha1!=alpha2)c(阿尔法是我的拦截)
所以测试一下是截取一次(=>alpha1==alpha2)还是截取两次(alpha1!=alpha2)比较好
在这种情况下,我们现在显然会拒绝零假设,因为 p 值为 0.6676。
这意味着我们应该坚持使用模型fm4,因为它更适合我们的数据。
我得出的结论对吗?我尽了最大努力,但我不确定 p 值是什么意思。因为只有 on,这就是我认为它可能的意思。 有人可以澄清一下吗?
【问题讨论】:
标签: r regression linear-regression anova