【问题标题】:Meaning of band width in ggplot geom_smooth lmggplot geom_smooth lm中带宽的含义
【发布时间】:2015-04-10 18:12:07
【问题描述】:

使用以下代码:

library(ggplot2)
ggplot(mtcars, aes(x=wt, y=mpg)) +
    geom_point(aes(colour=factor(cyl))) +
    geom_smooth(method="lm")

我可以得到这个情节:

我的问题是灰色区域是如何定义的?它有什么意义。 以及如何使用控制该频带宽度的各种参数?

【问题讨论】:

  • 这是标准错误。

标签: r ggplot2


【解决方案1】:

默认情况下,它是线性模型 (“lm”) 预测的 95% 置信水平区间。 ?geom_smooth 的文档指出:

此几何图形的默认统计数据是 stat_smooth,请参阅该文档以获取更多选项来控制基础统计转换。

更深一层,来自?stat_smooth 的文档告诉我们用于计算平滑器面积的方法。

为了快速获得结果,可以使用 stat_smooth 的参数之一,即 level使用的置信区间水平(默认为 0.95) p>

通过将该参数传递给 geom_smooth,它会依次传递给 stat_smooth,因此如果您希望拥有更窄的区域,例如可以使用 .90作为置信水平:

ggplot(mtcars, aes(x=wt, y=mpg)) +
    geom_point(aes(colour=factor(cyl))) +
    geom_smooth(method="lm", level=0.90)

【讨论】:

  • 谢谢。置信区间 (CI) 在这里告诉我们什么?您如何选择 CI 的“理想”级别?
  • 没有“理想”水平,只有或多或少保守(谨慎)的水平。对于它告诉我们的内容,我建议查看?predict?predict.lm。基本上,它表示如果我们一遍又一遍地重复实验(采样),我们的预测将是“范围”。一次抽样导致一条直线预测;考虑到数据的可变性,如果您愿意,这些区域会指示一系列可能的直线。通过将级别设置为 0.9,我们说“如果我们一遍又一遍地重复采样,则 90% 的回归线将位于该灰色区域内”。
  • 是否可以显示除 se 之外的其他内容?例如,数据的第 10 和第 90 分位数?
  • 为什么选择的级别越低越窄?
  • @SimonWoodward 也许看看quantile regression
【解决方案2】:

这是置信区间。如果不想显示,可以使用se=FALSE。如果您想要 99% CI 而不是 95% CI,也可以使用 level = 0.99。有关所有详细信息,请参阅?stat_smooth

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2018-10-15
    • 2019-08-21
    • 2020-04-03
    • 2020-01-26
    • 1970-01-01
    • 1970-01-01
    • 2021-07-27
    • 2018-08-04
    相关资源
    最近更新 更多