【发布时间】:2018-09-22 21:38:33
【问题描述】:
对于具有以下变量的数据:Student_ID、Start_week、Sy、Item、Type、School、Tuition 和 Country。如果观察具有相同的(Student_Id、Start_week、Sy、Item、Type 和 School)组合,则它是重复观察。
例如:
Student_ID Start_week Sy Item Type School
10001 1 11 101 0 2
10001 1 11 101 0 2
这两个观察是重复的,因为它具有相同的组合值。我正在做的是:
proc freq data = mydataset;
by Student_ID;
tables Start_week Sy Item Type School;
run;
但是,这并没有真正帮助我了解哪些是重复的,哪些不是。我想创建一个计数变量来计算重复项,但它没有捕获组合,而只是捕获了 Student_ID。此外,通过使用 proc freq,它的内存不足。
识别重复值的有效方法有哪些?
【问题讨论】:
标签: sas