【发布时间】:2017-05-19 09:34:24
【问题描述】:
我已经训练了一个模型来预测某个变量。当我现在使用此模型来预测所述值并将此预测与实际值进行比较时,我得到以下两个分布。
对应的R Data Frame如下:
x_var | kind
3.532 | actual
4.676 | actual
...
3.12 | predicted
6.78 | predicted
这两个分布显然具有略微不同的均值、分位数等。我现在想做的是将这两个分布合并为一个(尤其是因为它们非常相似),但 不 像以下thread。
相反,我想绘制一个密度函数来显示实际值和预测值之间的差异,并让我能够说 例如50% 的预测值在实际值的 -X% 和 +Y% 范围内。
我尝试绘制predicted-actual 之间的差异以及与相应组的平均值相比的差异。然而,这两种方法都没有产生我想要的结果。对于绘制的分布,能够做出上述陈述尤为重要,即 50% 的预测在实际值的 -X% 和 +Y% 范围内。如何实现?
【问题讨论】:
标签: r ggplot2 density-plot