【发布时间】:2019-02-09 14:35:47
【问题描述】:
我的数据集如下所示:
Category Weekly_Date a b
<chr> <date> <dbl> <dbl>
1 aa 2018-07-01 36.6 1.4
2 aa 2018-07-02 5.30 0
3 bb 2018-07-01 4.62 1.2
4 bb 2018-07-02 3.71 1.5
5 cc 2018-07-01 3.41 12
... ... ... ... ...
我分别为每组拟合线性回归:
fit_linreg <- train %>%
group_by(Category) %>%
do(model = lm(Target ~ Unit_price + Unit_discount, data = .))
现在每个类别都有不同的模型:
aa model1
bb model2
cc model3
所以,我需要将每个模型应用到适当的类别。如何做到这一点? (最好使用 dplyr)
【问题讨论】:
-
我不清楚您所说的“将每个模型应用于适当的类别”是什么意思。您有三个模型,您是否要运行预测?
-
每个类别的商品都在某个日期售出。所以我对每个类别进行回归。所以,我对每个类别都有单独的模型,需要为 aa model1、bb - model2 等类别运行。
-
再一次,"need to run for category" 是什么意思?获取模型系数? P值?厄普西隆?使用其他(测试)数据并计算预测?用训练数据计算预测?打印模型摘要(包括上述大部分内容)?我不是在争论,对我来说,你的“运行模型”可能意味着很多事情,虽然每个人的答案可能都是相似的,但我不想花时间回答你没有问过的问题。
-
(换一种说法。)如果你有一个用于
aa类别的模型存储为一个名为model1的变量,你会用它做什么?coef(model1),predict(model1, newdata),summary(model1)?一旦你知道你想用其中一个模型做什么,然后用map应用它,比如... %>% mutate(summ = purrr::map(model, ~ summary(.)), coefs = purrr::map(model, ~ coef(.)))。
标签: r dplyr time-series grouping forecasting