如何在 lm 中指定参数估计之间的关系？答案

【问题标题】：How can I specify a relationship between parameter estimates in lm?如何在 lm 中指定参数估计之间的关系？
【发布时间】：2023-03-22 09:25:02
【问题描述】：

使用 lm，我想拟合模型： y = b0 + b1*x1 + b2*x2 + b1*b2*x1*x2

我的问题是：如何指定交互作用的系数应等于主效应系数的乘积？

我已经看到将系数设置为特定值，您可以使用 offset() 和 I() 但我不知道如何指定系数之间的关系。

这是一个简单的模拟数据集：

n <- 50 # Sample size
x1 <- rnorm(n, 1:n, 0.5) # Independent variable 1
x2 <- rnorm(n, 1:n, 0.5) # Independent variable 2
b0 <- 1 
b1 <- 0.5
b2 <- 0.2
y <- b0 + b1*x1 + b2*x2 + b1*b2*x1*x2 + rnorm(n,0,0.1)

为了拟合模型 1：y = b0 + b1*x1 + b2*x2 + b3*x1*x2，我会使用：

summary(lm(y~ x1 + x2 + x1:x2))

但是如何拟合模型 2：y = b0 + b1*x1 + b2*x2 + b1*b2*x1*x2？

两个模型之间的主要区别之一是要估计的参数数量。在模型 1 中，我们估计 4 个参数：b0（截距）、b1（变量 1 的斜率）、b2（变量 2 的斜率）和 b3（变量 1 和 2 之间相互作用的斜率）。在模型 2 中，我们估计了 3 个参数：b0（截距）、b1（变量 1 的斜率和变量 1 和 2 之间相互作用的部分斜率）和 b2（变量 2 的斜率和部分斜率） vars. 1 和 2 之间的交互）

之所以要这样做，是因为在调查x1&x2之间是否存在显着交互作用时，模型2，y=b0+b1*x1+b2*x2+b1*b2*x1*x2，可以成为比 y = b0 + b1*x1 + b2*x2 更好的空模型。

非常感谢！

玛丽

【问题讨论】：

搜索带约束的线性回归。您会在 R 中找到许多参考资料。
Ramnath，这是一个非线性等式约束——线性不等式和等式约束很容易，但我觉得这不属于这一类吗？
我认为这里的答案很好。我唯一要补充的是，如果您想使用nls()（因为置信区间/p 值的估计比 delta 方法方法稍微准确一些）但是很难找到合适的起始值（因为@987654324 @可以挑剔），您可以使用lm估计参数并将它们放入nls()作为起始值。（我在回答另一个我现在似乎找不到的 SO 问题时提出了这个建议。）
你是对的，本。约束是非线性的。使用lm 参数作为nls 的起点是一个很好的策略，我过去曾成功使用过。
您是否真的希望 b1 和 b2 同时最适合整个模型，或者您只是希望 b1 和 b2 的线性效应最适合但计算整个模型的拟合用于模型比较的数据？

标签： r lm

【解决方案1】：

没有办法做你在lm 中要求的事情，也没有理由让它能够做到。你运行lm 来估计你的系数。如果您不想估计系数，则不要在模型中包含预测变量。您可以使用coef 提取您想要的系数，然后将它们相乘。

请注意，忽略交互是不同的模型，将产生不同的 b1 和 b2。您也可以将I(x1 * x2) 留在其中而不使用系数。

至于您为什么要这样做，没有很好的先验理由证明您的约束模型实际上比简单的加法模型更适合。拥有更多 free 参数必然意味着模型拟合得更好，但您没有添加这一点，您添加了一个约束，在现实世界中，它可能会使其拟合得更差。在这种情况下，您是否认为它是与包括交互在内的模型进行比较的更好的“基线”？

【讨论】：

谢谢！我想这样做的原因是，在调查 x1 和 x2 之间是否存在显着交互时，模型 2，y = b0 + b1*x1 + b2*x2 + b1*b2*x1*x2，可以更好比 y = b0 + b1*x1 + b2*x2 的空模型。我想知道我是否可以用 lm 指定模型 2。
@MarieAuger-Methe 我不太理解你认为这种形式比没有交互项的模型更好的空模型的逻辑。但是您似乎可以通过在没有约束的情况下拟合完整模型然后使用 delta 方法进行您感兴趣的测试来运行该测试。

【解决方案2】：

由于您对系数施加的约束，您指定的模型不是线性模型，因此不能使用lm 来拟合它。您需要使用非线性回归，例如 nls。

> summary(nls(y ~ b0 + b1*x1 + b2*x2 + b1*b2*x1*x2, start=list(b0=0, b1=1, b2=1)))

Formula: y ~ b0 + b1 * x1 + b2 * x2 + b1 * b2 * x1 * x2

Parameters:
   Estimate Std. Error t value Pr(>|t|)    
b0 0.987203   0.049713   19.86   <2e-16 ***
b1 0.494438   0.007803   63.37   <2e-16 ***
b2 0.202396   0.003359   60.25   <2e-16 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 0.1121 on 47 degrees of freedom

Number of iterations to convergence: 5 
Achieved convergence tolerance: 2.545e-06

当你重写它时，你真的可以看到模型是非线性的

> summary(nls(y ~ b0+(1+b1*x1)*(1+b2*x2)-1, start=list(b0=0, b1=1, b2=1)))

Formula: y ~ b0 + (1 + b1 * x1) * (1 + b2 * x2) - 1

Parameters:
   Estimate Std. Error t value Pr(>|t|)    
b0 0.987203   0.049713   19.86   <2e-16 ***
b1 0.494438   0.007803   63.37   <2e-16 ***
b2 0.202396   0.003359   60.25   <2e-16 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 0.1121 on 47 degrees of freedom

Number of iterations to convergence: 5 
Achieved convergence tolerance: 2.25e-06

【讨论】：

【解决方案3】：

Brian 提供了一种方法来拟合您指定的约束模型，但如果您对无约束模型是否比约束模型更适合您感兴趣，您可以使用 delta 方法来检验该假设。

# Let's make some fake data where the constrained model is true
n <- 100
b0 <- 2
b1 <- .2
b2 <- -1.3
b3 <- b1 * b2
sigma <- 1

x1 <- rnorm(n)
# make x1 and x2 correlated for giggles
x2 <- x1 + rnorm(n) 
# Generate data according to the model
y <- b0 + b1*x1 + b2*x2 + b3*x1*x2 + rnorm(n, 0, sigma)

# Fit full model y = b0 + b1*x1 + b2*x3 + b3*x1*x2 + error
o <- lm(y ~ x1 + x2 + x1:x2)

# If we want to do a hypothesis test of Ho: b3 = b1*b2
# this is the same as Ho: b3 - b1*b2 = 0
library(msm)
# Get estimate of the difference specified in the null
est <- unname(coef(o)["x1:x2"] - coef(o)["x1"] * coef(o)["x2"])
# Use the delta method to get a standard error for
# this difference
standerr <- deltamethod(~ x4 - x3*x2, coef(o), vcov(o))

# Calculate a test statistic.  We're relying on asymptotic
# arguments here so hopefully we have a decent sample size
z <- est/standerr
# Calculate p-value
pval <- 2 * pnorm(-abs(z))
pval

我在this blog post 中解释了 delta 方法的用途以及如何在 R 中使用它。

扩展 Brian 的答案，您也可以通过将完整模型与约束模型进行比较来做到这一点 - 但是您必须使用 nls 来拟合完整模型才能轻松比较模型。

o2 <- nls(y ~ b0 + b1*x1 + b2*x2 + b1*b2*x1*x2, start=list(b0=0, b1=1, b2=1))
o3 <- nls(y ~ b0 + b1*x1 + b2*x2 + b3*x1*x2, start = list(b0 = 0, b1 = 1, b2 = 1, b3 = 1))
anova(o2, o3)

【讨论】：