【发布时间】:2020-03-31 23:27:40
【问题描述】:
我有一个包含三年数据的df。
df <- data.table( YEAR = c("1999", "1999", "2000", "1999","2000",
"2000","1999", "2000", "2001", "2001", "2001", "2001"),
Sex=c("M", "F","F", "M","M", "F","F", "F", "M", "F","F", "M"),
V3 = c(1,2,3,4,5,6,7,8,9,10,11,12),
V4 = rnorm(12, mean = 0, sd = 1))
每年的行数相同。 我想创建 3 个线性回归模型,每年一个。每年的火车组规模在不同年份之间应该是相同的。例如,每年 3 个训练实例和 1 个测试实例。 我知道一年有很多可能,比如:
df_1999 <- df1 %>%
filter (YEAR == 1999)
samp <- sample(nrow(df_1999), 0.75 * nrow(df_1999))
train <- df[samp, ]
test <- df[-samp, ]
model_1999 <- lm(V4 ~ V3+ factor(Sex), data = df_1999)
但我不知道如何立即获得它以适合每个 lm 模型。
【问题讨论】:
-
嗨,您应该添加有关您正在谈论的技术的标签,不是吗?