【发布时间】:2015-03-13 15:50:41
【问题描述】:
我有一个如下所示的数据集。现在我的问题很多。对于客户、任务和子任务的每种组合,我想排除前 10% 的极值。我想要输出 2 个数据集,一个是所有组合的极值,另一个是所有组合的正常值。
client task subtask time
a abc t1 12
a abc t2 23
b xyz t3 334
c ijk t1 1
c ijk t1 12
b xyz t1 12
a xyz t2 23
b ijk t3 24
a ijk t2 344
c xyz t3 34343
b ijk t2 34
c xyz t3 34
a xyz t1 23
c ijk t1 223
a ijk t1 23
b xyz t3 21
b ijk t1 45
a xyz t2 23
c ijk t3 45
【问题讨论】: