Stata 中的交互语法答案

【问题标题】：Interaction syntax in StataStata 中的交互语法
【发布时间】：2015-03-16 13:41:46
【问题描述】：

我的问题涉及在 Stata 中正确使用 # 与 ## 来交互分类变量和因变量。这是我想到的例子。

为了了解 x 对 y 的边际效应，我对两种类型进行了三种处理（A、B、C） 的实验主题（M，F）。要了解汇集的边际效应（假设我满足所有 OLS 标准），我可以运行 reg y x。但是，我还想了解每个“环境”中每个“物种”的边际效应，或者 x 与治疗和类型的相互作用。

首先，假设 x 是连续的，是估计合并边际效应的正确语法和治疗类型边际效应

reg y x i.treatment#i.type#c.x

或

reg y i.treatment#i.type##c.x

或者两者都不是？

其次，是只估计治疗类型边际效应的正确语法

reg y i.treatment#i.type#c.x, noconstant

常量在哪里被删除？如果保持常数，它是否代表汇集的响应？

很抱歉，如果这是一个基本问题，但经过几天的阅读，我仍然难以准确掌握 # 和 ## 之间的区别。提前谢谢了。

注意：建议的数据显然是一个面板，因此xtreg 命令更合适。为了简单起见，我只是假装数据更简单。

编辑：这是一个带有内置 Stata 数据集的示例。

    . reg price c.mpg##i.foreign

      Source |       SS       df       MS              Number of obs =      74
-------------+------------------------------           F(  3,    70) =    9.48
       Model |   183435281     3  61145093.6           Prob > F      =  0.0000
    Residual |   451630115    70  6451858.79           R-squared     =  0.2888
-------------+------------------------------           Adj R-squared =  0.2584
       Total |   635065396    73  8699525.97           Root MSE      =  2540.1

-------------------------------------------------------------------------------
        price |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
--------------+----------------------------------------------------------------
          mpg |  -329.2551   74.98545    -4.39   0.000    -478.8088   -179.7013
    1.foreign |  -13.58741   2634.664    -0.01   0.996    -5268.258    5241.084
              |
foreign#c.mpg |
           1  |   78.88826   112.4812     0.70   0.485    -145.4485     303.225
              |
        _cons |   12600.54   1527.888     8.25   0.000     9553.261    15647.81
-------------------------------------------------------------------------------

mpg 和1.foreign 分别捕捉汽车每加仑英里数的边际效应，以及无论是国外还是国内的价格。 foreign#c.mpg 捕捉到dummy 为1（即车外）时category dummy 与连续x 的交互作用？那么是什么捕获了国内（虚拟为零）与mpg 的交互？

【问题讨论】：

标签： stata

【解决方案1】：

1.

在下文中，您将包括x 的主要效果和三向交互。

reg y x i.treatment#i.type#c.x

您忽略了主要影响，特别是 treatment 和 type 的主要影响。

以下

reg y i.treatment#i.type##c.x

扩展到

reg y i.treatment#i.type c.x i.treatment#i.type#c.x

其中包括x的主效果，双向交互和三向交互。

四处寻找有关包含与（出）主效应的交互的信息。例如https://stats.stackexchange.com/questions/11009/including-the-interaction-but-not-the-main-effects-in-a-model。

2.

你说

我仍然很难准确掌握 # 和 ## 之间的区别。

这可以通过阅读help fvvarlist 和手册来阐明。在这个阶段，语法意味着什么似乎不是问题，而是如何指定模型，这将取决于理论表明什么，之前做了什么等。

3.

从你的例子

reg price c.mpg##i.foreign

扩展为

reg price c.mpg i.foreign c.mpg#i.foreign

（mpg和foreign的两个主要作用，以及它们之间的交互），你问

foreign#c.mpg 捕捉到当dummy 为1 时类别dummy 和连续x 之间的相互作用（即汽车是外国的）？那么如何捕捉家庭（虚拟为零）与 mpg 的相互作用？

写出模型有帮助（同样是两个主要影响和相互作用）：

price = 12600.54 - 329.2551 mpg - 13.58741 foreign + 78.88826 mpg foreign

这清楚地说明了mpg 对价格的影响如何受到foreign 的值的影响；以及foreign 对price 的影响如何受mpg 的值影响。因为foreign 只取值0 和1，所以mpg 对price 的影响更容易理解。只需将foreign 替换为

- 329.2551 mpg + 78.88826 mpg foreign

foreign == 1时，mpg的效果是-250.36684。当foreign == 0时，效果为-329.2551。

foreign 对price 的影响同样计算：

- 13.58741 foreign + 78.88826 mpg foreign

但现在替换为mpg。因为它是连续的，您可能应该插入几个 mpg 的值，以更好地了解它对 price 的影响（请参阅 help margins。）

（这都是假设相应的系数具有统计显着性。）

我感觉您的问题涉及理解 Stata 语法和统计问题的麻烦。首先可以通过阅读Stata帮助资源来澄清。关于第二个问题，您的问题的措辞使得 Cross-Validated 的人们将其作为编程问题丢弃了。

【讨论】：

罗伯托是正确的，像往常一样。对于交叉验证，这里有太多的 Stata，而对于 Stack Overflow，有太多的统计数据。这并不构成无法解决的困境，因为 Roberto 发布了应该有所帮助的材料，而 Statalist 是第三种选择。
谢谢罗伯托。那么，Statalist 是解决这个问题的更好途径吗？还是因为其他原因而被否决。
我没有对此投反对票；那些投反对票的人没有透露自己或解释。这很常见，因为有些人对否决者的反应很烦躁。但是投反对票的标准是“没有表现出任何研究努力”和“不清楚或没有用”。我的印象是，缺乏基于非常具体的代码的非常具体的问题会让你失望，而且当他们投反对票时，许多人认为一个问题不太可能使他人受益匪浅；当我对其他问题投反对票时，这对我来说是正确的。