【问题标题】:ggplot: Extend regression line to predicted value with different linetypeggplot:将回归线扩展到具有不同线型的预测值
【发布时间】:2018-06-03 07:26:28
【问题描述】:

有没有一种简单的方法可以将虚线从实线回归线的末端延伸到预测值?

以下是我的基本尝试:

x = rnorm(10)
y = 5 + x + rnorm(10,0,0.4)

my_lm <- lm(y~x)
summary(my_lm)

my_intercept <- my_lm$coef[1]
my_slope <- my_lm$coef[2]
my_pred = predict(my_lm,data.frame(x = (max(x)+1)))

ggdf <- data.frame( x = c(x,max(x)+1), y = c(y,my_pred), obs_Or_Pred = c(rep("Obs",10),"Pred") )

ggplot(ggdf, aes(x = x, y = y, group = obs_Or_Pred ) ) +
     geom_point( size = 3, aes(colour = obs_Or_Pred) ) + 
     geom_abline( intercept = my_intercept, slope = my_slope, aes( linetype = obs_Or_Pred ) )

这并没有给出我希望看到的输出。我在 SO 上查看了其他一些答案,但没有看到任何简单的东西。我想出的最好的是:

ggdf2 <- data.frame( x = c(x,max(x),max(x)+12), y = c(y,my_intercept+max(x)*my_slope,my_pred), obs_Or_Pred = c(rep("Obs",8),"Pred","Pred"), show_Data_Point = c(rep(TRUE,8),FALSE,TRUE) )

ggplot(ggdf2, aes(x = x, y = y, group = obs_Or_Pred ) ) +
     geom_point( data = ggdf2[ggdf2[,"show_Data_Point"],] ,size = 3, aes(colour = obs_Or_Pred) ) + 
     geom_smooth( method = "lm", se=F, aes(colour = obs_Or_Pred, linetype=obs_Or_Pred) )
 

这给出了正确的输出,但我必须包含一个额外的列来指定我是否要显示数据点。如果我不这样做,我会得到这两个图中的第二个,它在拟合回归线的末端有一个额外的点:

有没有更简单的方法告诉 ggplot 从线性模型中预测出一个点并画一条虚线?

【问题讨论】:

  • 你的方法对我来说似乎很简单。
  • 不得不提前进行预测,然后必须指定哪些行将显示为点,哪些行显示为线,这感觉很尴尬。预测/次数较少的情况下很好,但如果我想重复做,手动做会很乏味。
  • 我的意思是,ggplot 是一个 plotting 包,而不是建模包。它非常适合绘制您提供的数据。 geom_smooth 对于简单的用例来说是一个很好的便利,但是当你想要非标准的模型/预测时,你不应该感到惊讶,你需要明确地给它你想要绘制的数据。
  • 不,您不应该手动执行此操作,您应该编写一个小辅助函数来为您准备所有数据。
  • 公平点,格雷戈尔!

标签: r ggplot2 regression linear-regression prediction


【解决方案1】:

您可以仅使用实际数据绘制点并构建预测数据框以添加线条。请注意max(x) 出现两次,因此它可以是Obs 线和Pred 线的端点。我们还使用shape 美学,以便我们可以删除原本会出现在Pred 的图例键中的点标记。

# Build prediction data frame
pred_x = c(min(x),rep(max(x),2),max(x)+1)
pred_lines = data.frame(x=pred_x,
                        y=predict(my_lm, data.frame(x=pred_x)),
                        obs_Or_Pred=rep(c("Obs","Pred"), each=2))

ggplot(pred_lines, aes(x, y, colour=obs_Or_Pred, shape=obs_Or_Pred, linetype=obs_Or_Pred)) +
  geom_point(data=data.frame(x,y, obs_Or_Pred="Obs"), size=3) +
  geom_line(size=1) +
  scale_shape_manual(values=c(16,NA)) +
  theme_bw()

【讨论】:

    【解决方案2】:

    Semi-ugly:您可以使用scale_x_continuous(limits = 来设置用于预测的 x 值的范围。首先用fullrange = TRUE 绘制预测线,然后在顶部添加“观察到的”线。请注意,过度绘制的渲染并不完美,您可能希望稍微增加观察线的大小。

    ggplot(d, aes(x, y)) +
      geom_point(aes(color = "obs")) +
      geom_smooth(aes(color = "pred", linetype = "pred"), se = FALSE, method = "lm",
                                                          fullrange = TRUE) +
      geom_smooth(aes(color = "obs", linetype = "obs"), size = 1.05, se = FALSE, method = "lm") +
      scale_linetype_discrete(name = "obs_or_pred") +
      scale_color_discrete(name = "obs_or_pred") +
      scale_x_continuous(limits = c(NA, max(x) + 1))
    


    不过,我倾向于同意 Gregor 的观点:“ggplot 是绘图包,而不是建模包”。

    【讨论】:

      猜你喜欢
      • 2021-11-03
      • 2016-02-14
      • 1970-01-01
      • 2021-12-16
      • 1970-01-01
      • 2021-07-16
      • 2017-10-31
      • 2021-08-09
      • 1970-01-01
      相关资源
      最近更新 更多