【发布时间】:2018-08-30 07:33:34
【问题描述】:
我有一个名为 mydata 的数据框。以下是相关列的示例:
Backlog.Item.Type Item.Created.To.Closed.Days Item.Created.To.Finished.Days
User Story 67 84
Task 14 17
Task 9 10
Epic 105 NA
User Story 56 59
Bug 5 NA
现在,我想要完成以下操作:我想取Item.Created.To.Closed.Days 列和Item.Created.To.Finished.Days 列的平均值,按Backlog.Item.Type 分组,然后将两者相邻绘制。计算我使用的平均值,这是有效的:
mydata %>%
group_by(Backlog.Item.Type) %>%
summarise_at(vars(Item.Created.to.Closed.Days),
funs(mean(Item.Created.to.Closed.Days, na.rm = TRUE)))
对于绘图部分,我尝试了类似
mydata.long <- melt(mydata)
ggplot(mydata.long,
aes(Backlog.Item.Type, value, fill = variable)) +
geom_bar(stat = "identity", position = "dodge")
但我似乎无法让它工作。我还应该注意,我只想为两列绘制 Backlog.Item.Type == 'User Story' 和 Backlog.Item.Type == 'Task' 的均值。从视觉上表示,这就是我想要完成的:
请原谅我糟糕的绘画技巧!我对颜色或其他东西没有任何偏好,我只需要完成它:D 在此先感谢,我希望我已经足够清楚并以可以理解的方式提出了我的问题!
【问题讨论】:
-
您可以运行 dput(df) 然后将输出添加到您的问题中吗?
-
y 轴的计数是多少,如何获得它的值?
-
@Tung 我的数据集由 2700 行和 20 列组成,所以我认为我做不到!但是,我的问题中描述了所有相关的列和行。还是您需要更多?
-
@Antonis 抱歉,我应该更清楚一点。我希望 y 轴显示天数:按与 Item.Created.To.Closed.Days 和 Item.Created.To.Finished.Days 列相对应的积压项目类型分组的平均值。