【发布时间】:2020-03-06 11:00:20
【问题描述】:
我有一个预期收入和当前收入的数据集:
id currentsalary expectedsalary
1 1 NA 1500
2 2 NA 3000
3 3 NA NA
4 4 NA NA
5 5 NA 1500
6 6 1500 3000
7 7 NA 1500
8 8 NA 5000
9 9 1000 1500
10 10 3000 5000
我想显示预期净收入相对于当前净收入的分布(图表+结论)。我画直方图:
hist(df$expectedsalary, col="pink", xlab="salary")
hist(df$currentsalary, col="blue", add=T)
但它没有正确显示关系。我想将 id 放在 x 坐标以及 y 轴上的当前和预期薪水(可能是直方图上的一条线),以强调基于个人的预期薪水和当前薪水之间的差异。我该怎么做?
【问题讨论】:
-
我推荐 cran.r-project.org/web/packages/ggridges/vignettes/… 包,例如转到
Density ridgeline plotssection。包设计用于覆盖不同类别的数据分布。您可能需要从宽到长重新调整数据,请查看rdocumentation.org/packages/reshape2/versions/1.4.3/topics/melt 了解此 -
如果您想要 x 轴上的 id,那么条形图似乎更合适。
ggplot(reshape2::melt(dat, id=1), aes(factor(id), value, fill=variable)) + geom_col(position="dodge")怎么样。还是画出差异?