如何在stata中合并两个具有ID变化的数据集答案

【问题标题】：How can I merge two data sets with ID variation in stata如何在stata中合并两个具有ID变化的数据集
【发布时间】：2020-07-22 14:55:16
【问题描述】：

我有以下两个数据集。

孩子们的第一个看起来像这样。

ID 年份 Q1 Q2 Q3 Q4 ....

101 2014 1 2 2 2

101 2016 1 2 2 2

101 2017 1 2 2 2

101 2018 1 2 2 2

401 2014 1 2 2 2

401 2015 1 2 3 3

401 2016 1 2 2 2

401 2017 1 2 1 1

401 2018 1 2 2 2

402 2014 1 1 0 3

402 2015 1 1 2 2

402 2016 1 1 2 2

402 2017 1 1 3 3

402 2018 1 1 2 3

这是他们父母的第二个。

ID 年份 Q101 Q102

1 2014 1 3

1 2015 1 3

1 2016 1 3

1 2017 1 2

1 2018 1 2

2 2014 2 .

2 2015 1 2

2 2016 年。 .

2 2017 1 3

2 2018 2 .

4 2014 1 3

4 2015 1 3

4 2016 1 3

4 2017 1 3

4 2018 1 3

因此，父数据 ID 可以与删除最后两位数字的子数据 ID 匹配。似乎父母 ID 4 有两个孩子。

我试过了使用孩子数据作为主数据集合并 1:m ID。但它没有用。

谢谢。

【问题讨论】：

因此，在此信息中，子数据集中的父标识符为 floor(ID/100)。您需要在父标识符上使用 merge 1:m 或 merge m:1（取决于您采用哪种方式），该标识符在两个数据集中必须具有相同的名称。
请参阅 Stata 标签 wiki 或 statalist.org/forums/help#stata，了解如何使用代码呈现真实或真实的数据示例。这将帮助您更快地获得好的答案。
我编辑了这个问题。感谢您的信息
我运行这个。 save kids,replace、use kids、merge m:1 floor(ID/100) parents 并且错误显示“不允许使用因子变量和时间序列运算符”。
对不起，不是我的暗示。您确实需要使用该配方来generate 一个新变量，并且在任何情况下merge 都需要一个或多个要合并的变量名称（而不是表达式）。正如我所说，标识符在两个数据集中必须具有相同的名称。

标签： merge panel stata

【解决方案1】：

通过 (a) 尝试代码并展示您尝试过的内容以及 (b) 以任何使用 Stata 的人都可以运行的代码的形式提供数据，更有可能获得好的答案。这里的代码来自编辑您的帖子，并且接近您可以通过使用 dataex 直接获得的代码，如 Stata 标记 wiki 中所述，或者实际上在最新的 Stata 或您安装的 @ 中的 help dataex来自 SSC 的 987654323@。

clear 
input ID year Q1 Q2 Q3 Q4 
101 2014 1 2 2 2
101 2016 1 2 2 2
101 2017 1 2 2 2
101 2018 1 2 2 2
401 2014 1 2 2 2
401 2015 1 2 3 3
401 2016 1 2 2 2
401 2017 1 2 1 1
401 2018 1 2 2 2
402 2014 1 1 0 3
402 2015 1 1 2 2
402 2016 1 1 2 2
402 2017 1 1 3 3
402 2018 1 1 2 3
end 

gen IDP = floor(ID/100)
save children 

clear 
input ID year Q101 Q102
1 2014 1 3
1 2015 1 3
1 2016 1 3
1 2017 1 2
1 2018 1 2
2 2014 2 .
2 2015 1 2
2 2016 . .
2 2017 1 3
2 2018 2 .
4 2014 1 3
4 2015 1 3
4 2016 1 3
4 2017 1 3
4 2018 1 3
end 

rename ID IDP 

merge 1:m IDP year using children 

list 

     +----------------------------------------------------------------------+
     | IDP   year   Q101   Q102    ID   Q1   Q2   Q3   Q4            _merge |
     |----------------------------------------------------------------------|
  1. |   1   2014      1      3   101    1    2    2    2       matched (3) |
  2. |   1   2015      1      3     .    .    .    .    .   master only (1) |
  3. |   1   2016      1      3   101    1    2    2    2       matched (3) |
  4. |   1   2017      1      2   101    1    2    2    2       matched (3) |
  5. |   1   2018      1      2   101    1    2    2    2       matched (3) |
     |----------------------------------------------------------------------|
  6. |   2   2014      2      .     .    .    .    .    .   master only (1) |
  7. |   2   2015      1      2     .    .    .    .    .   master only (1) |
  8. |   2   2016      .      .     .    .    .    .    .   master only (1) |
  9. |   2   2017      1      3     .    .    .    .    .   master only (1) |
 10. |   2   2018      2      .     .    .    .    .    .   master only (1) |
     |----------------------------------------------------------------------|
 11. |   4   2014      1      3   401    1    2    2    2       matched (3) |
 12. |   4   2015      1      3   401    1    2    3    3       matched (3) |
 13. |   4   2016      1      3   402    1    1    2    2       matched (3) |
 14. |   4   2017      1      3   401    1    2    1    1       matched (3) |
 15. |   4   2018      1      3   402    1    1    2    3       matched (3) |
     |----------------------------------------------------------------------|
 16. |   4   2014      1      3   402    1    1    0    3       matched (3) |
 17. |   4   2015      1      3   402    1    1    2    2       matched (3) |
 18. |   4   2016      1      3   401    1    2    2    2       matched (3) |
 19. |   4   2017      1      3   402    1    1    3    3       matched (3) |
 20. |   4   2018      1      3   401    1    2    2    2       matched (3) |
     +----------------------------------------------------------------------+

就merge 而言，基本要素是两个数据集中具有相同名称的标识符和正确的合并模式。父标识符仅由子数据集隐含。

【讨论】：