【发布时间】:2011-04-21 18:52:45
【问题描述】:
如果我在回归中使用二元解释变量,我如何告诉 R 使用某个水平作为参考?
默认情况下它只是使用一些级别。
lm(x ~ y + as.factor(b))
b {0, 1, 2, 3, 4}。假设我想使用 3 而不是 R 使用的零。
【问题讨论】:
-
您应该在模型公式/拟合之外进行数据处理步骤。从
b创建因子时,您可以使用factor(b, levels = c(3,1,2,4,5))指定级别的顺序。不过,请在lm()调用之外的数据处理步骤中执行此操作。我在下面的答案使用relevel()函数,因此您可以创建一个因子,然后根据需要调整参考水平。 -
我改写了你的问题。您实际上是在更改参考水平之后,而不是遗漏一个。
-
感谢重新措辞我的问题。事实上, relevel() 是我正在寻找的。感谢详细的答案和示例。我不确定线性回归标签是否有点误导,因为这适用于使用虚拟解释的各种回归......
标签: r regression linear-regression categorical-data dummy-variable