【问题标题】:Coefficients reported with restricted-cubic-splines in R package rms在 R 包 rms 中使用受限三次样条报告的系数
【发布时间】:2015-05-09 12:40:52
【问题描述】:

我试图了解 R 中包 rms 的一些输出,其中我在分位数回归中使用受限三次样条。我在理解输出时遇到的问题可能更多地与受限三次样条线有关,而不是与我在分位数回归中使用它们的事实有关。我拟合了 k=3 节的受限三次样条函数,如下所示:

fitted.model <- Rq(y ~ rcs(x, 3), x=TRUE, y=TRUE, tau=0.50, data=d)

我对这个事实感到困惑

coef(fitted.model)

显示:

  Intercept        x       x' 

39.67901296  0.31760226  0.01875437 

Function(fitted.model)

显示:

function(x = 56.15) {39.679013+0.31760226* x+1.2554621e-05*pmax(x-38.45,0)^3-2.3161627e-05*pmax(x-56.15,0)^3+1.0607006e-05*pmax(x-77.1,0)^3 }

给定 RMS 书中的公式 2.24 和 2.25,我预计系数 β0、β1 和 β2(即 βk-1) 获得的coef(fitted.model) 将是Formula(fitted.model) 所示的前三个(即k-1)系数。 X 的截距 (β0) 和系数 (β1) 显然相同,但公式中显示的 β2 不是与coef(fitted.model) 中的第二个系数相同。我误解了什么?

【问题讨论】:

    标签: r regression


    【解决方案1】:

    Functioncoef 报告的系数由于归一化而彼此不同。我无法在我一直在阅读的回归建模策略一书中找到任何关于规范化需求(或其优点和缺点)的描述。但是,标准化在 Frank Harrell 的 Hmisc 包中名为 rcspline.eval 的函数的文档中进行了简要描述,其中 norm 参数解释如下:

    norm: 0 使用 Devlin 和 Weeks 最初给出的术语 (1986), 1 通过间距的立方对非线性项进行归一化 在最后两个结之间,用 2 的平方归一化 第一个结和最后一个结之间的间距(默认值)。 norm=2 有 使所有非线性项都在 x 尺度上的优势。

    因此,在我的问题中使用的示例中,两个系数 1.2554621×10-50.01875437 由乘法相关因数(77.1-38.45)2 = 38.652 = 1493.82,即例子中第一个结和最后一个结的差的平方.

    归一化的最终效果是通过归一化因子改变回归 β 权重,对于构造的样条变量,而不是截距或不变的 x 变量。正如 Harrell 所解释的,它使权重(系数)在 x 的尺度方面更易于解释。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2017-05-07
      • 1970-01-01
      • 2022-07-29
      • 1970-01-01
      • 2021-11-13
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多