【发布时间】:2018-01-16 18:14:22
【问题描述】:
我有数百万患者遭遇的大型数据集,其中包括诊断、时间戳、患者 ID 和人口统计信息。
对于每位患者,他们的诊断都列在多行中。我需要排除具有某种诊断(282.1)的患者,并计算2014年其他疾病的发病率。
IF diagnosis NE 282.1;
这在数据步骤中不起作用,因为它没有考虑其他行的其他诊断。
如果可能的话,我还想按疾病计算发病率。
这是数据外观的示例。有多个诊断的多行。
PatientID Diagnosis Date Gender Age
1 282.1 1/2/10 F 25
1 232.1 1/2/10 F 87
1 250.02 1/2/10 F 41
1 125.1 1/2/10 F 46
1 90.1 1/2/10 F 58
2 140 12/15/13 M 57
2 132.3 12/15/13 M 41
2 149.1 12/15/13 M 66
3 601.1 11/19/13 F 58
3 231.1 11/19/13 F 76
3 123.1 11/19/13 F 29
4 282.1 12/30/14 F 81
4 130.1 12/30/14 F 86
5 230.1 1/22/14 M 60
5 282.1 1/22/14 M 46
5 250.02 1/22/14 M 53
【问题讨论】:
-
您需要与 282.1 不同的几种疾病的发病率还是很多?
-
@DirkHorsten 我需要很多疾病的发病率,不同于 282.1
-
您需要什么发病率:每次诊断和患者 ID 的就诊/治疗次数或每次诊断的就诊/治疗次数或每次诊断的不同患者 ID ?可能您可以添加一些您希望结果看起来如何的片段。
-
@DirkHorsten 我需要的发病率是给定年份中每次诊断的不同 PatientID。例如,我想制作一张表格,其中包含一系列疾病及其发病率。
-
如果某人在2013年诊断为282.1,您是否需要排除他/她对2011年其他疾病的诊断? 2015 年呢?
标签: sas bioinformatics frequency