【发布时间】:2012-10-18 09:26:11
【问题描述】:
如果我有一个包含 4137 个观测值的数据集,我想在 hsperc 上对 colga 进行回归,并且只使用前 2070 个观测值,我该怎么做?
我尝试过类似的方法:
# loading data
GPA2 <- read.table("GPA2.raw", header=TRUE, na.strings=".")
# fitting model
mfit1 <- lm( formula = colgpa ~ hsperc + sat, data=GPA2, subset=(rownum<2071) )
但是使用rownum 的subset 失败了。有什么建议吗??
我没有计算行数的变量,我应该有吗?那样的话,我该怎么做呢?
【问题讨论】:
-
您可以使用
data = GPA2[1:2070, ]并省略subset参数。 -
我同意上述观点。如果可能,最好避免使用子集。在 Hadley 的在线资料中,他有示例并解释了原因。
标签: r regression dataset