【发布时间】:2019-11-08 16:07:21
【问题描述】:
我想知道为什么lm() 说5 coefs not defined because of singularities 然后在总结输出中给出所有NA 5 个系数。
请注意,我所有的预测都是分类的。
我在这 5 个系数或代码上的数据有什么问题吗?我该如何解决这个问题?
d <- read.csv("https://raw.githubusercontent.com/rnorouzian/m/master/v.csv", h = T) # Data
nms <- c("Age","genre","Length","cf.training","error.type","cf.scope","cf.type","cf.revision")
d[nms] <- lapply(d[nms], as.factor) # make factor
vv <- lm(dint~Age+genre+Length+cf.training+error.type+cf.scope+cf.type+cf.revision, data = d)
summary(vv)
前 6 行输出:
Coefficients: (5 not defined because of singularities)
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.17835 0.63573 0.281 0.779330
Age1 -0.04576 0.86803 -0.053 0.958010
Age2 0.46431 0.87686 0.530 0.596990
Age99 -1.64099 1.04830 -1.565 0.118949
genre2 1.57015 0.55699 2.819 0.005263 **
genre4 NA NA NA NA ## For example here is all `NA`s? there are 4 more !
【问题讨论】:
-
如果您有分类变量,请使用
glm而不是lm。
标签: r dataframe regression