【发布时间】:2016-11-15 03:13:00
【问题描述】:
我有两个 SAS 数据集,我试图将它们与一个公共 by 变量合并在一起(在 by 变量下方的 mcve 中是record)。不过,这种合并有一个条件,这就是我遇到的麻烦。我需要通过record 将fileone 与filetwo 合并,但filetwo 中与fileone 匹配的行必须满足以下条件:intervention_date 必须在该记录之后'case_start (如果record 有多个case_start,则在下一个case_start 之前)。
这是fileone 的示例:
data fileone;
input record case_start :date9. age;
format case_start date9.;
datalines;
1 01jun2015 10
1 15jan2016 11
1 19jul2016 11
2 11aug2016 15
;
run;
这是filetwo 的示例:
data filetwo;
input record intervention_date :date9. county :$10.;
format intervention_date date9.;
datalines;
1 24mar2016 Denver
1 10sep2015 Denver
1 20oct2016 Denver
2 15nov2016 Boulder
2 12dec2016 Boulder
;
run;
指出一些事情,来自fileone 的record 可以有多个case_start 日期(请参阅record=1),对于每个record 和case_start 日期,一个来自@987654344 的record @ 可以有多个intervention_date(参见record=2)。
更具体地说,这就是我想要制作的:
data what_merge_should_look_like;
input record case_start :date9. age intervention_date :date9. county :$10.;
format case_start intervention_date date9.;
datalines;
1 01jun2015 10 10sep2015 Denver
1 15jan2016 11 24mar2016 Denver
1 19jul2016 11 20oct2016 Denver
2 11aug2016 15 15nov2016 Boulder
2 11aug2016 15 12dec2016 Boulder
;
run;
现在,像简单的 by merge 这样的东西不起作用,因为它只匹配 record:
/* data already sorted on by variable */
data fileone_two;
merge fileone
filetwo;
by record;
run;
对于将这两个数据集与此日期条件合并有什么建议吗?这可能来自一个简单的 SAS 数据步骤,因为我对 proc sql 不是很熟悉吗?我已经看到使用 proc sql 完成此操作,但想了解数据步骤。
【问题讨论】: