【发布时间】:2016-05-25 09:12:59
【问题描述】:
我想比较两个数据集并将匹配的观察结果提取到新数据集。例如,
我有两个数据集,一个来自 10 月,另一个来自 11 月,如下所示。
10 月数据集
visitor_id ctn visits
kjsjakd83 3243244234 1
sakdsadda 5432223442 2
jhk43242l 3243243244 1
iiiewdaja 9839422022 2
11 月数据集
visitor_id ctn visits
kjsjakd83 3243244234 1
432hj4hj 3243243244 2
jhk43242l 3243243244 1
xfd3x424 2342344234 2
现在,我想通过 CTN 比较这些数据集,并从 10 月数据集中提取在 11 月数据集中找到匹配 CTN 的所有观察结果。因此,提取的数据集必须如下所示。
数据集匹配
visitor_id ctn visits
kjsjakd83 3243244234 1
jhk43242l 3243243244 1
如何在 SAS 中做到这一点?
【问题讨论】:
-
请发布您到目前为止尝试过的代码,这听起来像是一个简单的内部连接。我也不清楚最后一个数据集(匹配)是您引用的第三个数据集,还是您想要的输出数据集。最后,为什么在 11 月的数据中,同一个 ctn 有 2 个访问者 id?你认为哪一个相关?
-
proc sql; create table final as select Distinct a.CTN, a.visits from Nov a inner join Oct b on b.CTN = a.CTN; quit; -
上面的代码显示了来自两个数据集的匹配行但是我只想要匹配来自 11 月数据集的行