【发布时间】:2016-05-09 20:35:13
【问题描述】:
我正在开展一个项目,该项目需要我运行 Heckman 2 阶段模型,这对我来说很新,在两个阶段都使用 probit。作为一项经验检查,我在 Stata 和 R 中运行了模型。我正在运行带有“sampleSelection”包的 Stata 13 和 R v. 3.2.3。问题是我得到了不同的结果,我认为这是因为我对代码背后的算法缺乏了解。也许我缺少论点。我知道的一件事是 R 正在为第二阶段而不是概率运行一个 Tobit 模型。我想知道是否有人可能对如何让 R 在两个阶段都使用概率方法来运行 2 阶段模型有所了解。下面我先包含了 Stata 代码和结果,然后是 R 代码和结果。
状态码
heckprob ivburden isingle recuse50 infobk2 timesurv inh icp itime igate ioth,
select(iw5rsp= i201 isingle icatmpgte7 ichgfrwv inh icp itime igate ioth) vce(robust)
R 代码
library(sampleSelection)
heckit(selection = iw5rsp ~ i201 + isingle + icatmpgte7 + ichgfrwv +
inh + icp + itime + igate + ioth,
outcome = ivburden ~ isingle + recuse50 + infobk50 + timesurv +
inh + icp + itime + igate + ioth, data = dat,
method = "2step")
任何建议将不胜感激。
【问题讨论】:
-
最好从该包的帮助页面开始,看看功能是否按照您的想法执行:cran.r-project.org/web/packages/sampleSelection/…
-
在较小的数据样本上运行时,有什么方法可以提供一小部分数据样本以及模型代码的 stata 和 R 输出?要提供数据样本(便于在 R 中使用),请使用
dput()。例如,要提供数据的前 20 行,请粘贴dput(dat[1:20, ])的输出,以及使用该数据运行的 stata 和 R 模型的输出(或任何数据样本说明您的问题并使您的问题可重现。 -
tobit和probit是一样的吗? -
这不是我对tobit和probit区别的理解的一个很好的描述。我的理解是,tobit 分布是基于截断的高斯分布,而概率模型是基于未截断的。这只是与我感兴趣的领域有一定的交叉,而且我对 Stata 方法一无所知。
-
我相信一些混淆在于具有样本选择的最大似然概率模型有时被称为 II 型 Tobit,不要与用于审查结果数据的 I 型混淆。请参阅here 了解更多信息。