【发布时间】:2022-10-25 08:01:26
【问题描述】:
我有一个庞大的数据集,并试图按类别绘制一种boxplot 与 Q1、Q2、Q3 统计数据。我想要一个带有标准四分位数范围框和勾勒中位数的粗线的箱线图可视化,但不是胡须和异常值。我还想按类别添加平均值。
因为我的数据量很大,所以计算所有这些数据然后将统计数据绘制为identity 会更容易。我找到了下面的代码,它计算统计数据然后绘制它们。但是,当我从代码中删除 ymin 和 ymax 时,它不起作用。我想要一个类似的代码:(i)没有最大值和最小值,(ii)将平均值添加为一个点,(iii)按类别计算和绘制统计数据。
y <- rnorm(100)
df <- data.frame(
x = 1,
y0 = min(y),
y25 = quantile(y, 0.25),
y50 = median(y),
y75 = quantile(y, 0.75),
y100 = max(y)
)
ggplot(df, aes(x)) +
geom_boxplot(
aes(ymin = y0, lower = y25, middle = y50, upper = y75, ymax = y100),
stat = "identity"
)
【问题讨论】:
标签: r visualization boxplot quartile