【发布时间】:2018-02-26 23:06:15
【问题描述】:
我尝试对数据框的选定部分进行多次回归。 有 22 列。一个是“日期”,一个是“索引”和 S1、S2、S3 ... S20。
我以这种方式运行回归:
Regression <- lm(as.matrix(df[c('S1', 'S2', 'S3', 'S4', 'S5', 'S6', 'S7', 'S8', 'S9', 'S10', 'S11', 'S12', 'S13', 'S14', 'S15', 'S16', 'S17', 'S18', 'S19', 'S20')]) ~ df$INDEX)
Regression$coefficients
1) 如何使代码更短?就像使用区间告诉 R:将 S1 到 S20 列作为解释变量,并使用因变量 INDEX 对它们进行回归。
2) 回归公式为:a + b*INDEX + error 然后从回归中提取所有“b”估计值。假设这些列有 10 行,所以必须有 10 个估计值。 同时提取所有错误:即每列必须有 10 个错误,总共 10*20=200 个错误。
由于我没有使用 R 的经验,欢迎各种帮助!谢谢!
【问题讨论】:
-
对不起,我把它弄混了:S 变量是依赖的,INDEX 是解释性的。 S = a + b*INDEX + 误差
标签: r loops dataframe regression