【发布时间】:2013-03-17 15:37:16
【问题描述】:
我正在做一个基本的箱线图,其中y=age 和x=Patient groups
age <- ggplot(data, aes(factor(group2), age)) + ylim(15, 80)
age + geom_boxplot(fill = "grey80", colour = "#3366FF")
我希望你能帮我做一些事情:
1) 是否可以在每个组箱线图上方(但不在我的组标签所在的 X 轴上)包含每个组的多个观察值,而不必在绘画中执行此操作:)? 我试过使用:
age + annotate("text", x = "CON", y = 60, label = "25")
其中CON 是第一组,y = 60 是 ~ 就在该组的箱线图上方。但是,该命令不起作用。我认为它与将x 读取为连续变量而不是分类变量有关。
2) 此外,尽管有很多关于箱线图使用均值而不是中值的问题,但我仍然没有找到适合我的代码?
3) 在同样的问题上,有没有一种方法可以将平均组统计数据包含在箱线图中?也许使用
age + stat_summary(fun.y=mean, colour="red", geom="point")
然而,它只包括一个点,表示平均值所在的位置。或再次使用
age + annotate("text", x = "CON", y = 30, label = "30")
其中CON 是第一组,y = 30 是~ 组年龄平均值。
知道ggplot2 语法是多么灵活和丰富,我希望有一种更优雅的方式来使用真实的统计输出而不是annotate。
任何建议/链接将不胜感激!
谢谢!!
【问题讨论】:
-
箱线图通常有最小、下、中、上分位数,最后是最大值。您已经有了 .25、.5 和 .75 分位数。这些信息还不够丰富吗?
-
这是我被要求的格式。