【发布时间】:2022-01-19 11:38:35
【问题描述】:
我有 2 个数据集,一个是基础数据集,另一个是它的子集,我想创建一个数据集,其中记录不存在于子集数据集中但存在于基础数据集中。因此,如果子集中不存在 acct_num test_id trandate actual_amt 的组合,那么它应该出现在结果数据集中。
DATA base;
INPUT acct_num test_id tran_date:anydtdte. actual_amt final_amt final_amt_added ;
format tran_date date9.;
DATALINES;
55203610 2542 12-jan-20 30 45 45
16124130 8062 . 56 78 78
16124130 8062 14-dec-19 8 78 78
80479512 2062 19-mar-19 32 32 32
70321918 2062 20-dec-19 1 93 54
17312410 6712 . 45 90 90
17312410 6712 15-jun-18 0 90 90
74623123 2092 17-aug-18 34 87 87
24245321 2082 22-jan-17 22 56 67
;
run;
data subset;
input acct_num test_id tran_date:anydtdte. actual_amt final_amt final_amt_added ;
format tran_date date9.;
DATALINES;
55203610 2542 12-jan-20 30 45 45
16124130 8062 . 56 78 78
16124130 8062 14-dec-19 8 78 78
17312410 6712 . 45 90 90
74623123 2092 17-aug-18 34 87 87
24245321 2082 22-jan-17 22 56 67
;
run;
我想要的数据
80479512 2062 19-mar-19 32 32 32
70321918 2062 20-dec-19 1 93 54
17312410 6712 15-jun-18 0 90 90
我尝试在 SQL 中使用 not in 函数,但它与该语句中的多个变量不匹配。 任何帮助将不胜感激。
【问题讨论】:
-
请正确格式化您的数据以使其可以使用,因为它现在一团糟且无法使用。
-
我有敏感数据不能共享,这只是一个例子,我只是想知道要使用的逻辑