【发布时间】:2021-06-17 15:00:11
【问题描述】:
我有一组数据,其中包含一个输出变量和一组标签。我面临的问题是标签不是相互排斥的。例如,假设我正在分析绘画,并且正在查看绘画的价格和用于创作它的颜色。我会有一个如下所示的数据集:
| Price | Colors Used |
|---|---|
| 10 | Red, Black, Blue |
| 12.5 | Red, Green, Yellow, Black, purple |
| 11 | Blue, White |
| 15 | Red |
我想使用 ggplot2 为所用颜色中包含“红色”的所有行创建一个价格箱线图,然后对“紫色”、“黑色”等执行相同的操作。但问题是我遇到的是,如果我简单地写,GGplot2 会将这些标签中的每一个都视为唯一的
ggplot(aes(x=colors, y=price))+
geom_boxplot()
有人知道解决这个问题的好方法吗?
【问题讨论】: