【发布时间】:2021-04-14 14:50:24
【问题描述】:
方框表示连续变量在组内的分布;红色圆圈是显示所有实际观察的点。到现在为止还挺好。这将是简单的geom_boxplot + geom_point 与群体审美。
这里有两个转折:
- 点的水平位置不是随机抖动。它们是使用连续 X 轴而不是分类轴的 X-Y 坐标
- 这条线是适合这些点的趋势线。
一些上下文:
该图显示了产品的使用情况(Y 轴)与允许的使用情况(X)。 X 轴组是互斥的离散层,本质上是一个无限的连续使用变量。 EG, 1-4, 5-9, 10-20 等等。从视觉的角度来看,在这些组中绘制连续图对我来说并不疯狂,这有意义吗?但我不知道如何开始让ggplot2 同意我的观点。
我的偏好是让箱形图沿 X 轴均匀分布,但如果我需要从轴连续开始,并让各组在 X 轴上占据成比例的空间,那么我会解决为此(可能使用记录轴以防止较低、较窄的组被完全弄脏。
这应该可以作为示例数据:
df <- structure(list(usage = c(1L, 4L, 2L, 5L, 4L, 1L, 2L, 98L, 9L,
4L, 6L, 6L, 1L, 2L, 2L, 2L, 3L, 2L, 5L, 1L), allowed = c(2, 20,
3, 3, 5, 5, 1, 1, 1, 5, 10, 5, 7, 12, 2, 5, 23, 10, 5, 2), id = c(1055L,
2155L, 6637L, 11068L, 2070L, 8524L, 9157L, 5963L, 7593L, 3470L,
3557L, 7469L, 9142L, 408L, 9446L, 1552L, 4788L, 7233L, 8464L,
2188L), group = c("A", "B", "A", "A", "A", "A", "A", "A", "A",
"A", "B", "A", "B", "B", "A", "A", "B", "B", "A", "A")), row.names = c(NA,
-20L), class = c("tbl_df", "tbl", "data.frame"))
【问题讨论】:
标签: r ggplot2 data-visualization