【发布时间】:2017-10-16 14:59:24
【问题描述】:
在下面的代码中,我怎样才能只保留高于第 95 个分位数的观察值?
data test;
input business_ID $ count;
datalines;
'busi1' 2
'busi1' 10
'busi1' 4
'busi2' 1
'busi3' 2
'busi3' 1
;
run;
proc sort data = test;
by descending count;
run;
我不知道如何干净地存储四分位数,然后在 if 条件下重新使用它。
谢谢
编辑:我可以用这段代码确定分位数:
proc means data=test noprint;
var count;
output out=quantile P75= / autoname;
run;
但是我如何在 Test 数据集中关联它,以便我可以选择高于该分位数的每个观察值?
【问题讨论】:
-
发布您到目前为止所尝试的内容。您可以使用 PROC MEANS、UNIVARIATE 或 RANK 来查找百分位数。