【发布时间】:2019-10-24 14:22:33
【问题描述】:
我想为回归分析模拟数据,其中涉及一个虚拟变量。虽然回归会恢复斜率,但不会恢复截距:
beta <- c(2,3,4)
x1 <- rnorm(100,50,5)
x2 <- sample(c(0,1), replace=T,100)
eps <- rnorm(100, 0, 5)
y <- beta[1] + beta[2]*x1 + beta[3]*x2 + eps
summary(lm(y~x1 + x2))
Call:
lm(formula = y ~ x1 + x2)
Residuals:
Min 1Q Median 3Q Max
-12.6598 -2.7433 -0.2873 2.4616 13.2250
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -8.2858 5.3470 -1.550 0.124
x1 3.2216 0.1070 30.109 < 2e-16 ***
x2 3.9209 0.9065 4.325 3.7e-05 ***
我知道虚拟变量会向上或向下移动截距,但我对要进行哪些调整来创建可以恢复截距的数据集感到困惑。任何建议都非常感谢,谢谢。
【问题讨论】:
标签: r regression simulation