【问题标题】:sas covariates in a linear regressions线性回归中的 sas 协变量
【发布时间】:2016-05-26 01:58:02
【问题描述】:

我在 SAS 中运行一个简单的线性回归。回归有三组不同的参与者作为预测变量(第 1 组作为参考),结果是一个连续的社会支持变量和五个协变量。其中三个协变量是二分的(agesex、&education),一个是三级名义变量(marital status),最后一个是连续变量(chronic disease index)。

我的问题是:我是否需要以某种方式在 SAS 编码中指定不同类型的协变量?

这个编码示例正确吗?:

proc glm data=work.example;

class group age sex education marital education chronic_diseases;

model social_support = group age sex education marital education chronic_diseases;

estimate 'group 1 vs group 2' group -1 1 0;

estimate 'group 1 vs group 3' group -1 0 1;

run;

【问题讨论】:

  • 这可能是PROC PLS 产生比PROC GLM 更好的结果(更小的均方根误差)的情况,因为您的预测变量可能相互关联。

标签: sas linear-regression


【解决方案1】:

class 语句告诉 SAS 您要考虑一个非连续变量:即分类变量或二进制变量。它不会区分两者,因为除非您指定参考组,否则默认情况下它将根据升序的第一个值选择参考。

例如,如果您要比较 ApplesOranges,SAS 将使用 Apples 作为参考值。嘿,它们是水果——你可以比较水果和水果! :)

除非在class 语句中指定,否则所有模型协变量都被视为数字。由于chronic_diseases 是连续的,只需将其从class 语句中删除即可;否则,SAS 将查看chronic_diseases 的每一个值并将其视为一个级别,然后将它们全部与最低级别进行比较。

proc glm data=work.example;
    class group age sex education marital education;

    model social_support = group age sex education marital education chronic_diseases;

    estimate 'group 1 vs group 2' group -1 1 0;
    estimate 'group 1 vs group 3' group -1 0 1;
run;

【讨论】:

    猜你喜欢
    • 2016-02-03
    • 2014-05-08
    • 2019-04-13
    • 1970-01-01
    • 1970-01-01
    • 2011-01-06
    • 1970-01-01
    • 1970-01-01
    • 2014-10-31
    相关资源
    最近更新 更多