【发布时间】:2019-12-12 20:00:59
【问题描述】:
我是全新的,所以请对我宽容:-)
我正在寻找一种解决方案来删除同一列中的某个值不同的异常值:
body_mass age
1 19 11
2 20 10
3 26 8
4 21 6
5 18 12
6 18 7
7 30 11
8 17 8
9 17 10
10 18 8
boxplot(body_mass~age, data = df, subset=age %in% c(0:22))$out
outliers <- boxplot(body_mass~age, data = df, subset=age %in% c(0:22))$out
df[which(df$body_mass %in% outliers),]
df <- df[-which(df$body_mass %in% outliers),]
但是尝试这种方式,会删除所有年龄的所有值,即使它们只是一个年龄类别的异常值
【问题讨论】:
-
请原谅格式化...这是我的主题
-
编辑您的问题以添加所用语言的标签(对我来说,它看起来像 R,但我不确定您的问题,它可能是另一种制作类似外观图形的语言) - 这个将有助于确保可以帮助查看您的问题的人。
-
您将什么定义为异常值?从统计学上讲。有几种方法可以根据问题定义异常值。