【问题标题】:Interaction syntax in StataStata 中的交互语法
【发布时间】:2015-03-16 13:41:46
【问题描述】:

我的问题涉及在 Stata 中正确使用 ### 来交互分类变量和因变量。这是我想到的例子。

为了了解 xy 的边际效应,我对两种类型进行了三种处理(A、B、C) 的实验主题(M,F)。要了解汇集的边际效应(假设我满足所有 OLS 标准),我可以运行 reg y x。但是,我还想了解每个“环境”中每个“物种”的边际效应,或者 x 与治疗和类型的相互作用。

首先,假设 x 是连续的,是估计合并边际效应的正确语法治疗类型边际效应

reg y x i.treatment#i.type#c.x

reg y i.treatment#i.type##c.x

或者两者都不是?

其次,是只估计治疗类型边际效应的正确语法

reg y i.treatment#i.type#c.x, noconstant

常量在哪里被删除?如果保持常数,它是否代表汇集的响应?

很抱歉,如果这是一个基本问题,但经过几天的阅读,我仍然难以准确掌握 ### 之间的区别。提前谢谢了。

注意:建议的数据显然是一个面板,因此xtreg 命令更合适。为了简单起见,我只是假装数据更简单。

编辑:这是一个带有内置 Stata 数据集的示例。

    . reg price c.mpg##i.foreign

      Source |       SS       df       MS              Number of obs =      74
-------------+------------------------------           F(  3,    70) =    9.48
       Model |   183435281     3  61145093.6           Prob > F      =  0.0000
    Residual |   451630115    70  6451858.79           R-squared     =  0.2888
-------------+------------------------------           Adj R-squared =  0.2584
       Total |   635065396    73  8699525.97           Root MSE      =  2540.1

-------------------------------------------------------------------------------
        price |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
--------------+----------------------------------------------------------------
          mpg |  -329.2551   74.98545    -4.39   0.000    -478.8088   -179.7013
    1.foreign |  -13.58741   2634.664    -0.01   0.996    -5268.258    5241.084
              |
foreign#c.mpg |
           1  |   78.88826   112.4812     0.70   0.485    -145.4485     303.225
              |
        _cons |   12600.54   1527.888     8.25   0.000     9553.261    15647.81
-------------------------------------------------------------------------------

mpg1.foreign 分别捕捉汽车每加仑英里数的边际效应,以及无论是国外还是国内的价格。 foreign#c.mpg 捕捉到dummy 为1(即车外)时category dummy 与连续x 的交互作用?那么是什么捕获了国内(虚拟为零)与mpg 的交互?

【问题讨论】:

    标签: stata


    【解决方案1】:

    1.

    在下文中,您将包括x 的主要效果和三向交互。

    reg y x i.treatment#i.type#c.x
    

    您忽略了主要影响,特别是 treatmenttype 的主要影响。

    以下

    reg y i.treatment#i.type##c.x
    

    扩展到

    reg y i.treatment#i.type c.x i.treatment#i.type#c.x
    

    其中包括x的主效果,双向交互和三向交互。

    四处寻找有关包含与(出)主效应的交互的信息。例如https://stats.stackexchange.com/questions/11009/including-the-interaction-but-not-the-main-effects-in-a-model

    2.

    你说

    我仍然很难准确掌握 # 和 ## 之间的区别。

    这可以通过阅读help fvvarlist 和手册来阐明。在这个阶段,语法意味着什么似乎不是问题,而是如何指定模型,这将取决于理论表明什么,之前做了什么等。

    3.

    从你的例子

    reg price c.mpg##i.foreign
    

    扩展为

    reg price c.mpg i.foreign c.mpg#i.foreign
    

    mpgforeign的两个主要作用,以及它们之间的交互),你问

    foreign#c.mpg 捕捉到当dummy 为1 时类别dummy 和连续x 之间的相互作用(即汽车是外国的)?那么如何捕捉家庭(虚拟为零)与 mpg 的相互作用?

    写出模型有帮助(同样是两个主要影响和相互作用):

    price = 12600.54 - 329.2551 mpg - 13.58741 foreign + 78.88826 mpg foreign
    

    这清楚地说明了mpg 对价格的影响如何受到foreign 的值的影响;以及foreignprice 的影响如何受mpg 的值影响。因为foreign 只取值01,所以mpgprice 的影响更容易理解。只需将foreign 替换为

    - 329.2551 mpg + 78.88826 mpg foreign
    

    foreign == 1时,mpg的效果是-250.36684。当foreign == 0时,效果为-329.2551

    foreignprice 的影响同样计算:

    - 13.58741 foreign + 78.88826 mpg foreign
    

    但现在替换为mpg。因为它是连续的,您可能应该插入几个 mpg 的值,以更好地了解它对 price 的影响(请参阅 help margins。)

    (这都是假设相应的系数具有统计显着性。)

    我感觉您的问题涉及理解 Stata 语法和统计问题的麻烦。首先可以通过阅读Stata帮助资源来澄清。关于第二个问题,您的问题的措辞使得 Cross-Validated 的人们将其作为编程问题丢弃了。

    【讨论】:

    • 罗伯托是正确的,像往常一样。对于交叉验证,这里有太多的 Stata,而对于 Stack Overflow,有太多的统计数据。这并不构成无法解决的困境,因为 Roberto 发布了应该有所帮助的材料,而 Statalist 是第三种选择。
    • 谢谢罗伯托。那么,Statalist 是解决这个问题的更好途径吗?还是因为其他原因而被否决。
    • 我没有对此投反对票;那些投反对票的人没有透露自己或解释。这很常见,因为有些人对否决者的反应很烦躁。但是投反对票的标准是“没有表现出任何研究努力”和“不清楚或没有用”。我的印象是,缺乏基于非常具体的代码的非常具体的问题会让你失望,而且当他们投反对票时,许多人认为一个问题不太可能使他人受益匪浅;当我对其他问题投反对票时,这对我来说是正确的。
    猜你喜欢
    • 2015-05-29
    • 2014-04-17
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-06-16
    • 1970-01-01
    相关资源
    最近更新 更多