【发布时间】:2019-05-25 14:59:58
【问题描述】:
你好堆栈社区,
我正在尝试使用线性模型对美国各地区的工资增长进行建模,以预测未来。我想尝试为每个州/地区(DC、VI 和 PR)创建一个模型,但是,当我查看模型的系数时,每个州的系数都是相同的。
到目前为止,我已经使用了 plyr、dplyr 和 broom 的组合来为这个项目创建和排序我的数据框(名为 stuben_dat)
#Wage Growth
state_data = stuben_dat %>% group_by(st) %>%
do (state_wg= lm(wage_growth ~ us_wage_growth + lag_wage_growth + dum1
+dum2 +dum3,
data= stuben_dat, subset=yr>= (current_year - 5)))
#The dummy variables adjust for seasonality (q1 vs q2 vs q3 vs q4)
#The current_year = whatever year I last updated the program
#The current_year-5 value lets me change the look back period
#This look back period can be used to exclude recessions or outliers
这只是我输出的快照,如您所见,此处显示了每个状态(仅 AK 和 AL)的 beta 系数和回归统计数据完全相同。但是,我想为每个州建立不同的模型。
# A tibble: 318 x 6
# Groups: st [53]
st term estimate std.error statistic p.value
<chr> <chr> <dbl> <dbl> <dbl> <dbl>
1 AK (Intercept) -1.75 0.294 -5.97 3.28e- 9
2 AK us_wage_growth 996. 23.6 42.2 1.82e-228
3 AK lag_wage_growth 0.191 0.0205 9.34 5.58e- 20
4 AK dum1 -0.245 0.304 -0.806 4.21e- 1
5 AK dum2 -0.321 0.304 -1.06 2.90e- 1
6 AK dum3 0.0947 0.303 0.312 7.55e- 1
7 AL (Intercept) -1.75 0.294 -5.97 3.28e- 9
8 AL us_wage_growth 996. 23.6 42.2 1.82e-228
9 AL lag_wage_growth 0.191 0.0205 9.34 5.58e- 20
10 AL dum1 -0.245 0.304 -0.806 4.21e- 1
# ... with 308 more rows
【问题讨论】:
标签: r linear-regression