【发布时间】:2018-05-15 15:58:41
【问题描述】:
我有前 3 名的数据。我正在尝试创建一个在 x 轴上具有列名称(成本/产品)的图,y 值是频率(理想情况下是相对频率,但我不确定如何在 dplyr 中获得它)。
我正在尝试根据 dplyr 中汇总的值来创建它。我有一个看起来像这样的 dplyr 数据框:
likelyReasonFreq<- LikelyRenew_Reason %>%
filter(year==3)%>%
filter(status==1)%>%
summarize(costC = count(cost),
productsC = count(products))
> likelyReasonFreq
costC.x costC.freq productsC.x productsC.freq
1 1 10 1 31
2 2 11 2 40
3 3 17 3 30
4 NA 149 NA 86
我正在尝试创建一个条形图,显示成本和产品的总(总和)频率。因此,成本的频率将是排名第 1、2 或 3 次的频率,因此为 38。本质上,我将行 1:3 相加(对于产品,它将是 101(不包括 NA 值)。
我不知道该怎么做,有什么想法吗?
下面是变量similarReasonFreq
> dput(head(likelyReasonFreq))
structure(list(costC = structure(list(x = c(1, 2, 3, NA), freq = c(10L,
11L, 17L, 149L)), .Names = c("x", "freq"), row.names = c(NA,
4L), class = "data.frame"), productsC = structure(list(x = c(1,
2, 3, NA), freq = c(31L, 40L, 30L, 86L)), .Names = c("x", "freq"
), row.names = c(NA, 4L), class = "data.frame")), .Names = c("costC",
"productsC"), row.names = c(NA, 4L), class = "data.frame")
感谢任何建议!
【问题讨论】:
-
您能解释一下您是如何得到这些数字的:“因此,成本频率为 38,产品频率为 101”?
-
我正在对频率列的 1:3 行中的值求和