【发布时间】:2013-07-15 00:59:02
【问题描述】:
我有柱状数据集,我正在绘制一系列箱形图,与本示例中的设置最相似: Boxplot of table using ggplot2
require(reshape2)
ggplot(data = melt(dd), aes(x=variable, y=value)) + geom_boxplot(aes(fill=variable))
但是,就我而言,每个箱线图代表不同数量的数据点。例如,A 列可能有 8000 个数据点,B 列可能有 6000 个,C 列可能有 2500 个,D 列可能有 800 个。
为了帮助传达这一点,我想我可以对框的填充颜色设置 alpha 以反映数据点的数量。盒子越暗,用于计算箱线图所代表的统计数据的数据点就越多。
在 geom_histogram 的 ggplot2 帮助文件中,他们使用 aes(fill=..count..) 对与 bin 中的计数 # 对应的 bin 进行着色。
m <- ggplot(movies, aes(x=rating))
m + geom_histogram(aes(fill=..count..))
(想在此处包含示例直方图的图片,但不能因为我没有足够的声望点...抱歉)
我尝试将它与我的 ggplot geom_boxplot 一起使用,但它似乎不知道 ..count.. 部分。 这是我生成箱线图的线:
ggplot(meltedData, aes(x=variable, y=value)) + geom_boxplot(aes(fill=variable), outlier.size = 1) + ylim(-4,3)
有人指点一下吗?我知道我可以将“alpha”属性添加到 geom_boxplot,但是如何根据箱线图中的数据点数将其单独应用于每个箱线图?
提前致谢。
【问题讨论】:
-
您能否提供一个reproducible example 您要绘制的列?
-
我不太了解整个
..count..系统,但我认为它适用于直方图,因为stat="bin"参数。您可能只需将count添加到数据本身。