【问题标题】:regression homework in RR中的回归作业
【发布时间】:2012-12-01 23:07:59
【问题描述】:

我有一个标记为不同城市债券的数据集: $y$=债券收益率,$x_1$=报价规模($\$$1000 债券)和 $x_2$=到期期限(100 个月)。 我需要比较所有模型 $y=b_0+b_2x_2$、$y=c_0+c_1x_1+c_2x_2$ 和 $y=d_0+d_1x_1$ 的系数。

我能够制作第一个模型,但其他两个模型出现错误。这是前六个城市的值。

> head(bond)
  N0       City X1   X2   Y  
1  1 Birmingham 30 1.81 335 
2  2     Oxnard 10 1.93 365 
3  3    Salinas 30 2.79 315 
4  4    Danbury 15 1.81 325 
5  5  New Haven 15 1.87 283 
6  6    Norwalk 40 2.17 300  

线性模型 2 是 c <- lm(y ~ X1 + X2, bond) 产生

Error in model.frame.default(formula = y ~ X1 + X2, data = bond, drop.unused.levels = TRUE) : 
  variable lengths differ (found for 'X1')

最后一个模型是d <- lm(y ~ X1, bond),结果是

Error in model.frame.default(formula = y ~ X1, data = bond, drop.unused.levels = TRUE) : 
  variable lengths differ (found for 'X1')

问题:我不明白错误或如何继续纠正它。

【问题讨论】:

  • 您检查过 $y$、$x_1$ 和 $x_2$ 中的缺失值吗?
  • 是的,每一列在y,x1和x2中都有一个值
  • @mark.这看起来像是一个 R 问题,而不是一个统计问题,因此会在带有“[r]”标签的 stackoverflow 上进行。

标签: r regression


【解决方案1】:

看起来 y 和 X1 的长度不同。我打赌那是因为你应该使用 Y 而不是 y。

函数ls() 有时可以帮助您找到可能意外使用的名称相似的额外变量。你可以随时rm 任何你不需要的。除非您对变量的使用非常自律,否则每次开始工作前清理工作区通常是个好主意。

【讨论】:

    猜你喜欢
    • 2015-02-22
    • 1970-01-01
    • 2012-11-28
    • 2017-07-21
    • 2021-07-29
    • 2018-06-05
    • 2012-01-13
    • 2012-08-07
    • 1970-01-01
    相关资源
    最近更新 更多