【问题标题】:What is the meaning of the "Residual standard error" in summary() for lm() regression in R?对于 R 中的 lm() 回归,summary() 中的“剩余标准误差”是什么意思?
【发布时间】:2019-12-08 23:17:09
【问题描述】:

当我使用 R 运行 lm() 回归时,我从 summary() 中得到“残差标准错误”。为什么每个观测值只有一个残差标准误值而不是残差标准误列表?

summary() 中显示的这个值是什么意思? summary() 中显示的“残余标准误差”是每个观察值的残余标准误差列表的平均值吗?谢谢。

Residual standard error: 0.8498 on 44848 degrees of freedom
  (7940 observations deleted due to missingness)
Multiple R-squared:  0.4377,    Adjusted R-squared:  0.4375

【问题讨论】:

  • 第一个 Google 搜索结果:(stats.stackexchange.com/questions/57746/…) 带有许多指向其他相关问题的链接。
  • 关于接近投票,这个问题似乎是关于解释 R 函数的输出,这是关于使用该函数进行编程的,所以似乎相关。

标签: r regression lm


【解决方案1】:

残差标准误差是衡量线性模型残差变异性的指标。它的平方用作 F 检验的分母,用于评估模型的拟合度。可以直接使用sigma检索

fm <- lm(mpg ~., mtcars)
sigma(fm)
## [1] 2.650197

或导出如下(假设所有系数都不为 NA):

sqrt(deviance(fm) / (nobs(fm) - length(coef(fm))))
## [1] 2.650197

这里deviance(fm) 给出了残差的平方和:

deviance(fm)
## [1] 147.4944

sum(resid(fm)^2)  # same
## [1] 147.4944

summary 的输出中也会显示残差标准误差:

summary(fm)
# ...snip...
## Residual standard error: 2.65 on 21 degrees of freedom
## Multiple R-squared:  0.869,     Adjusted R-squared:  0.8066 
## F-statistic: 13.93 on 10 and 21 DF,  p-value: 3.793e-07

F值

F 统计量将拟合值的可变性(在其分子中)与残差的可变性(在其分母中)进行比较。对于残差部分的可变性,它使用残差标准误差sigma(fm) 的平方。对于具有截距的模型,可以按如下方式计算。

# F value shown in summary

num <- sum( (fitted(fm) - mean(fitted(fm)))^2 ) / (length(coef(fm)) - 1) 
den <- sigma(fm)^2
num / den
# [1] 13.93246

特殊情况——仅拦截模型

在截距模型的特殊情况下,残差标准误差等于残差的标准差,但通常它们不相等。

# for intercept only model residual standard error equals sd(residuals)

fm0 <- lm(mpg ~ 1, mtcars)
sigma(fm0)
## [1] 6.026948

sd(resid(fm0))
## [1] 6.026948

【讨论】:

  • 对答案的清晰性和卓越性表示赞同。
猜你喜欢
  • 2018-11-20
  • 2017-12-14
  • 2011-12-16
  • 1970-01-01
  • 1970-01-01
  • 2013-06-29
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多