【发布时间】:2014-12-26 01:21:01
【问题描述】:
有一个数据集(在这里找到-https://netfiles.umn.edu/users/nacht001/www/nachtsheim/Kutner/Appendix%20C%20Data%20Sets/APPENC01.txt),我已经为线性回归做了一些 R 编码。在附加的数据集中,列未标记。我必须标记数据集的列并将其另存为 csv,我很抱歉我无法在这里得到它……但我使用的列是第 3 列(年龄)第 4 列(感染)第 5 列(文化比)列10(人口普查)和第 12 栏(服务),第 9 栏(地区)。我将数据集命名为医院。
我应该“对于每个地理区域,使用一阶回归模型对预测变量年龄、文化、人口普查、服务回归感染风险 (Y)。然后我需要找到每个区域的 MSE。这是我有的代码。
NE<- subset(hospital, region=="1")
NC<- subset(hospital, region=="2")
S<- subset(hospital, region=="3")
W<- subset(hospital, region=="4")
然后做一个一阶线性回归模型,我使用每个的基本代码
NE.Model<- lm(NE$infection~ NE$age + NE$culratio + NE$census + NE$service)
summary(NE.Model)
我可以得到调整后的 R 平方值,但是如何从这个输出中找到 MSE?
【问题讨论】:
-
mean(NE.Model$residuals^2)应该可以工作。
标签: r linear-regression