【发布时间】:2014-05-07 22:39:25
【问题描述】:
我想使用 dplyr 为每个小时(因子变量)拟合一个模型,但我遇到了一个错误,我不太确定出了什么问题。
df.h <- data.frame(
hour = factor(rep(1:24, each = 21)),
price = runif(504, min = -10, max = 125),
wind = runif(504, min = 0, max = 2500),
temp = runif(504, min = - 10, max = 25)
)
df.h <- tbl_df(df.h)
df.h <- group_by(df.h, hour)
group_size(df.h) # checks out, 21 obs. for each factor variable
# different attempts:
reg.models <- do(df.h, formula = price ~ wind + temp)
reg.models <- do(df.h, .f = lm(price ~ wind + temp, data = df.h))
我尝试了各种变体,但无法正常工作。
【问题讨论】:
-
一条评论。为什么要分组进行回归?也许更好的方法是对这个组变量使用具有随机效应的混合模型?
-
主要原因是数据至少受 3 个季节性影响:每小时、每周和每月的影响,所以为了摆脱一些变量,我将其拆分为 24 个模型.它的预测非常好 - 使用非常简单的模型,但是您能否链接到一个页面,其中包含有关您的意思和原因的更多信息?