【发布时间】:2020-04-27 07:46:45
【问题描述】:
首先让我道歉,但我是一名生物学家,从生物信息学领域开始,因此在 R 编程和统计领域。 我必须使用 Library(mvdalav) 中的数据 (Penta) 对多线性回归模型进行分析。
我必须尝试不同的模型,包括 PLS 模型,它是通常用于此数据集的模型 (https://rdrr.io/cran/mvdalab/f/README.md)
但是,他们要求我们使用更多模型的数据,我很迷茫,因为数据似乎总是给我错误:
1) 正态多元回归模型:
> mod2<-mod1<-lm(Penta1$log.RAI~.,Penta1)
> summary(mod2)
Call:
lm(formula = Penta1$log.RAI ~ ., data = Penta1)
Residuals:
ALL 30 residuals are 0: no residual degrees of freedom!
Coefficients: (15 not defined because of singularities)
Estimate Std. Error t value Pr(>|t|)
(Intercept) -1.000e-01 NA NA NA
Obs.NameAAWAA 8.500e-01 NA NA NA
Obs.NameAAYAA 5.600e-01 NA NA NA
Obs.NameEKWAP 1.400e+00 NA NA NA
Obs.NameFEAAK 4.000e-01 NA NA NA
Obs.NameFSPFR 7.400e-01 NA NA NA
Obs.NameGEAAK -4.200e-01 NA NA NA
Obs.NameLEAAK 5.000e-01 NA NA NA
Obs.NamePGFSP 1.000e+00 NA NA NA
Obs.NameRKWAP 2.080e+00 NA NA NA
Obs.NameRYLPT 5.000e-01 NA NA NA
Obs.NameVAAAK 1.114e-15 NA NA NA
Obs.NameVAAWK 3.300e-01 NA NA NA
Obs.NameVAWAA 1.530e+00 NA NA NA
Obs.NameVAWAK 1.550e+00 NA NA NA
Obs.NameVEAAK 6.100e-01 NA NA NA
Obs.NameVEAAP 2.800e-01 NA NA NA
Obs.NameVEASK 3.000e-01 NA NA NA
Obs.NameVEFAK 1.670e+00 NA NA NA
Obs.NameVEGGK -9.000e-01 NA NA NA
Obs.NameVEHAK 1.630e+00 NA NA NA
Obs.NameVELAK 6.900e-01 NA NA NA
Obs.NameVESAK 3.800e-01 NA NA NA
Obs.NameVESSK 1.000e-01 NA NA NA
Obs.NameVEWAK 2.830e+00 NA NA NA
Obs.NameVEWVK 1.810e+00 NA NA NA
Obs.NameVKAAK 2.100e-01 NA NA NA
Obs.NameVKWAA 1.810e+00 NA NA NA
Obs.NameVKWAP 2.450e+00 NA NA NA
Obs.NameVWAAK 1.400e-01 NA NA NA
S1 NA NA NA NA
L1 NA NA NA NA
P1 NA NA NA NA
S2 NA NA NA NA
L2 NA NA NA NA
P2 NA NA NA NA
S3 NA NA NA NA
L3 NA NA NA NA
P3 NA NA NA NA
S4 NA NA NA NA
L4 NA NA NA NA
P4 NA NA NA NA
S5 NA NA NA NA
L5 NA NA NA NA
P5 NA NA NA NA
Residual standard error: NaN on 0 degrees of freedom
Multiple R-squared: 1, Adjusted R-squared: NaN
F-statistic: NaN on 29 and 0 DF, p-value: NA
2) 研究逐步方法提供的简化模型。目的是比较训练组和测试组的简化模型和完整模型的 RMSE。
step(lm(log.RAI~.,data = penta),direction = "backward")
Error in step(lm(log.RAI ~ ., data = penta), direction = "backward") :
AIC is -infinity for this model, so 'step' cannot proceed
3)根据 AIC 的标准和调整后的 R2 找到最佳模型
4) PLS 模型 --> 符合以下数据:https://rdrr.io/cran/mvdalab/f/README.md
5) 也可以使用带有lm.ridge () 函数或类似函数的岭回归方法来研究它
6)最后我们将学习LASSO方法与Lasso项目的lars ()功能。
我非常不明白为什么 data.frame 会出现这些错误,以及如何进行分析。任何部分的任何帮助将不胜感激
亲切的问候
【问题讨论】:
-
您有该错误,因为您的大多数观察结果都是 n=1。我注意到你有 Penta1。和图书馆的 Penta 有什么区别(mvdalav)
标签: r statistics regression stat