【发布时间】:2012-12-01 23:07:59
【问题描述】:
我有一个标记为不同城市债券的数据集: $y$=债券收益率,$x_1$=报价规模($\$$1000 债券)和 $x_2$=到期期限(100 个月)。 我需要比较所有模型 $y=b_0+b_2x_2$、$y=c_0+c_1x_1+c_2x_2$ 和 $y=d_0+d_1x_1$ 的系数。
我能够制作第一个模型,但其他两个模型出现错误。这是前六个城市的值。
> head(bond)
N0 City X1 X2 Y
1 1 Birmingham 30 1.81 335
2 2 Oxnard 10 1.93 365
3 3 Salinas 30 2.79 315
4 4 Danbury 15 1.81 325
5 5 New Haven 15 1.87 283
6 6 Norwalk 40 2.17 300
线性模型 2 是 c <- lm(y ~ X1 + X2, bond) 产生
Error in model.frame.default(formula = y ~ X1 + X2, data = bond, drop.unused.levels = TRUE) :
variable lengths differ (found for 'X1')
最后一个模型是d <- lm(y ~ X1, bond),结果是
Error in model.frame.default(formula = y ~ X1, data = bond, drop.unused.levels = TRUE) :
variable lengths differ (found for 'X1')
问题:我不明白错误或如何继续纠正它。
【问题讨论】:
-
您检查过 $y$、$x_1$ 和 $x_2$ 中的缺失值吗?
-
是的,每一列在y,x1和x2中都有一个值
-
@mark.这看起来像是一个 R 问题,而不是一个统计问题,因此会在带有“[r]”标签的 stackoverflow 上进行。
标签: r regression