【发布时间】:2018-06-06 17:07:10
【问题描述】:
我正在处理一个数据集,该数据集由两组不同的观察值组成,其中值是整数。我想绘制它们的密度,以了解不同组在值上的分布情况。
发生的情况是一组具有“平滑”密度,而另一组具有“波浪”密度。我知道这与带宽有关,而且我的数据基本上与离散观察相关,但如果有人能准确解释原因,我会很高兴。
这是一个例子:
data2 <- rbind(
data.frame(group=rep('poisson1', 1000), value = rpois(1000, 5)),
data.frame(group=rep('poisson2', 1000), value = rpois(1000, 45)))
library(ggplot2)
ggplot(data2, aes(x=value, fill=group)) +
geom_density()
【问题讨论】:
-
查看
geom_density的文档。有许多参数会传递给底层的density函数,包括内核类型和带宽 -
是的,我确实阅读了 geom_density 的文档,这让我看到了 stats::density,我确信这与 x 值是离散的和选择的带宽有关。但是我仍然不完全清楚为什么,特别是当我可以从 rpois 的 lambda = 5 的 1000 个单个样本的绘图中看到相同的东西时。大多数时候密度图是平滑的,但每一次有一段时间不是。我希望有人能以我能理解的方式解释原因。
标签: r ggplot2 kernel-density density-plot