【问题标题】:How can I merge two data sets with ID variation in stata如何在stata中合并两个具有ID变化的数据集
【发布时间】:2020-07-22 14:55:16
【问题描述】:

我有以下两个数据集。

孩子们的第一个看起来像这样。

ID 年份 Q1 Q2 Q3 Q4 ....

101 2014 1 2 2 2

101 2016 1 2 2 2

101 2017 1 2 2 2

101 2018 1 2 2 2

401 2014 1 2 2 2

401 2015 1 2 3 3

401 2016 1 2 2 2

401 2017 1 2 1 1

401 2018 1 2 2 2

402 2014 1 1 0 3

402 2015 1 1 2 2

402 2016 1 1 2 2

402 2017 1 1 3 3

402 2018 1 1 2 3

这是他们父母的第二个。

ID 年份 Q101 Q102

1 2014 1 3

1 2015 1 3

1 2016 1 3

1 2017 1 2

1 2018 1 2

2 2014 2 .

2 2015 1 2

2 2016 年。 .

2 2017 1 3

2 2018 2 .

4 2014 1 3

4 2015 1 3

4 2016 1 3

4 2017 1 3

4 2018 1 3

因此,父数据 ID 可以与删除最后两位数字的子数据 ID 匹配。似乎父母 ID 4 有两个孩子。

我试过了 使用孩子数据作为主数据集合并 1:m ID。 但它没有用。

谢谢。

【问题讨论】:

  • 因此,在此信息中,子数据集中的父标识符为 floor(ID/100)。您需要在父标识符上使用 merge 1:mmerge m:1(取决于您采用哪种方式),该标识符在两个数据集中必须具有相同的名称。
  • 请参阅 Stata 标签 wiki 或 statalist.org/forums/help#stata,了解如何使用代码呈现真实或真实的数据示例。这将帮助您更快地获得好的答案。
  • 我编辑了这个问题。感谢您的信息
  • 我运行这个。 save kids,replaceuse kidsmerge m:1 floor(ID/100) parents 并且错误显示“不允许使用因子变量和时间序列运算符”。
  • 对不起,不是我的暗示。您确实需要使用该配方来generate 一个新变量,并且在任何情况下merge 都需要一个或多个要合并的变量名称(而不是表达式)。正如我所说,标识符在两个数据集中必须具有相同的名称。

标签: merge panel stata


【解决方案1】:

通过 (a) 尝试代码并展示您尝试过的内容以及 (b) 以任何使用 Stata 的人都可以运行的代码的形式提供数据,更有可能获得好的答案。这里的代码来自编辑您的帖子,并且接近您可以通过使用 dataex 直接获得的代码,如 Stata 标记 wiki 中所述,或者实际上在最新的 Stata 或您安装的 @ 中的 help dataex来自 SSC 的 987654323@。

clear 
input ID year Q1 Q2 Q3 Q4 
101 2014 1 2 2 2
101 2016 1 2 2 2
101 2017 1 2 2 2
101 2018 1 2 2 2
401 2014 1 2 2 2
401 2015 1 2 3 3
401 2016 1 2 2 2
401 2017 1 2 1 1
401 2018 1 2 2 2
402 2014 1 1 0 3
402 2015 1 1 2 2
402 2016 1 1 2 2
402 2017 1 1 3 3
402 2018 1 1 2 3
end 

gen IDP = floor(ID/100)
save children 

clear 
input ID year Q101 Q102
1 2014 1 3
1 2015 1 3
1 2016 1 3
1 2017 1 2
1 2018 1 2
2 2014 2 .
2 2015 1 2
2 2016 . .
2 2017 1 3
2 2018 2 .
4 2014 1 3
4 2015 1 3
4 2016 1 3
4 2017 1 3
4 2018 1 3
end 

rename ID IDP 

merge 1:m IDP year using children 

list 

     +----------------------------------------------------------------------+
     | IDP   year   Q101   Q102    ID   Q1   Q2   Q3   Q4            _merge |
     |----------------------------------------------------------------------|
  1. |   1   2014      1      3   101    1    2    2    2       matched (3) |
  2. |   1   2015      1      3     .    .    .    .    .   master only (1) |
  3. |   1   2016      1      3   101    1    2    2    2       matched (3) |
  4. |   1   2017      1      2   101    1    2    2    2       matched (3) |
  5. |   1   2018      1      2   101    1    2    2    2       matched (3) |
     |----------------------------------------------------------------------|
  6. |   2   2014      2      .     .    .    .    .    .   master only (1) |
  7. |   2   2015      1      2     .    .    .    .    .   master only (1) |
  8. |   2   2016      .      .     .    .    .    .    .   master only (1) |
  9. |   2   2017      1      3     .    .    .    .    .   master only (1) |
 10. |   2   2018      2      .     .    .    .    .    .   master only (1) |
     |----------------------------------------------------------------------|
 11. |   4   2014      1      3   401    1    2    2    2       matched (3) |
 12. |   4   2015      1      3   401    1    2    3    3       matched (3) |
 13. |   4   2016      1      3   402    1    1    2    2       matched (3) |
 14. |   4   2017      1      3   401    1    2    1    1       matched (3) |
 15. |   4   2018      1      3   402    1    1    2    3       matched (3) |
     |----------------------------------------------------------------------|
 16. |   4   2014      1      3   402    1    1    0    3       matched (3) |
 17. |   4   2015      1      3   402    1    1    2    2       matched (3) |
 18. |   4   2016      1      3   401    1    2    2    2       matched (3) |
 19. |   4   2017      1      3   402    1    1    3    3       matched (3) |
 20. |   4   2018      1      3   401    1    2    2    2       matched (3) |
     +----------------------------------------------------------------------+

merge 而言,基本要素是两个数据集中具有相同名称的标识符和正确的合并模式。父标识符仅由子数据集隐含。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-12-10
    • 1970-01-01
    相关资源
    最近更新 更多