倾向得分匹配与面板数据答案

【问题标题】：Propensity Score Matching with panel data倾向得分匹配与面板数据
【发布时间】：2021-06-06 02:46:34
【问题描述】：

我正在尝试使用 MatchIt 为我的面板数据执行倾向得分匹配 (PSM)。数据是面板数据，包含来自同一组公司的多年观察结果。

数据基本上是描述债券数据列表及其发行人的财务数据，以及发行日期、票面利率、期限、债券类型等债券条款。例如：

Firmnames	Year	ROA	Bond_type
AAPL US Equity	2015	0.3	0
AAPL US Equity	2015	0.3	1
AAPL US Equity	2016	0.3	0
AAPL US Equity	2017	0.3	0
C US Equity	2015	0.3	0
C US Equity	2016	0.3	0
C US Equity	2017	0.3	0

......

我已经知道如何根据我想要的标准匹配观察结果，我使用exact = Year 来确保我匹配同一年的观察结果。我现在面临的问题是来自同一家公司的观察将被匹配在一起，这不是我想要的。我使用的代码：

matchit(Bond_type ~ Year + Amount_Issued + Cpn + Total_Assets_bf + AssetsEquityRatio_bf + Asset_Turnover_bf, data = rdata, method = "nearest", distance = "glm", exact = "Year")

但是，如您所见，在我的样本的第二个原始样本中，由于我的研究性质，同一家公司一年内可能会有两次观察（该公司一年可以发行多次债券） .它们之间的唯一区别是 Bond_type。因此，MathcIt 函数当然会将它们视为最佳对照组和治疗组，并将这两个观察值匹配在一起，因为它们在当年具有相同的 ROA 和其他匹配因子。

我认为有两种方法可以解决这个问题：

删除同一年份和同一公司的观察结果，但是，删除观察结果可能会导致结果出现偏差并破坏研究。
防止MatchIt 函数与来自同一公司（或具有相同Frimnames）的观察结果相匹配

第二种方法会更好，因为它不会导致偏差，但是，我不知道我是否可以在MatchIt 函数中做到这一点。希望有人可以给我一些建议，或者也许有更好的解决方案，请与我分享，提前谢谢！

注意：如果我应该提供任何进一步的信息或要求，请告诉我。这是我第一次在这里提出问题！

【问题讨论】：

标签： r panel-data propensity-score-matching

【解决方案1】：

目前MatchIt 无法做到这一点（尽管这是一个有趣的想法并且不难实现，所以我可能会将其添加为一项功能）。

在执行最佳配对和完全匹配的optmatch 包中，可以添加一个称为“反精确匹配”的约束，这听起来完全符合您的要求。具有相同反精确匹配变量值的单位将不会相互匹配。这可以使用optmatch::antiExactMatch() 来实现。

在执行最近邻和遗传匹配的Matching 包中，可以将restrict 参数提供给匹配函数以限制某些匹配。您可以通过限制同一公司中的所有观察对来手动创建限制矩阵，然后将矩阵提供给Match()。

【讨论】：

你好诺亚，请理解你的回复对我来说意味着世界。我一定会试试你上面提到的包。请问以下问题，即如果我想执行最近邻方法，哪个包最适合我？我在研究中应用的方法需要它，所以我想知道我应该使用optmatch还是Matching来做到这一点。我只有有限的 R 编程经验（2 个月），我需要更多时间来学习一个新包，所以我最好选择一个最适合我需要的包。
最优匹配和无替换的NN匹配本质上是一回事。 optmatch 更易于使用，让您可以访问完全匹配（这是一种更好的方法），但对于大型数据集（> 100000 行）可能会很慢。 Matching 使用起来有点困难，但有更多的定制选项，并且可以访问基因匹配，这也是一个很好的方法，并且匹配替换。对于较大的数据集，它会更快。如果您在这里提出问题，我可以帮助您将它们用于您的目的。
嗨诺亚。再次感谢您回答我的详细问题。我会尝试optmatich，因为我的数据集远低于 100000 行。如果我遇到任何进一步的问题，我会再次提出我的问题，并希望得到您的有用和详细的答案。
很高兴我能帮上忙。随意将此答案标记为已选择，这样问题就不会挥之不去。顺便说一句，我决定将此功能添加到MatchIt，因此它应该会出现在下一个版本中。
没有问题，我会立即这样做。请问MatchIt'的最新版本什么时候发布？再次感谢您的好意。