【发布时间】:2019-01-13 02:03:43
【问题描述】:
我有一个包含 2000 多个观测值的大型数据集。数据涉及动物组织中的毒素浓度。我的响应变量是myRESULT,我对每个感兴趣的ANALYTE 有多个观察结果。我需要从每个ANALYTE 组中删除异常值,这些异常值由距平均值三个SD 以上的数字定义。
虽然我意识到我不应该正常地从数据集中删除异常值,但我仍然想知道如何在 R 中做到这一点。
这是我的数据的一小部分:
【问题讨论】:
-
请提供可重现的示例。我们没有时间手动将您的数字输入到 R 控制台。
-
我在这里问了一个类似的问题:stackoverflow.com/questions/51230775/…