【问题标题】:How to calculate percentage of count to specific condition? [duplicate]如何计算特定条件的计数百分比? [复制]
【发布时间】:2019-05-10 09:31:06
【问题描述】:

我的数据看起来像这样。

company  date  auditor  change  count
A        2016  ZXY      0       1
A        2015  ZXY      0       2
A        2014  ZXY      0       3
A        2013  FPQ      1       4
A        2012  ZXY      1       5
B        2017  ERW      0       1
B        2016  ERW      0       2
B        2015  ERW      0       3
B        2014  ERW      0       4
B        2013  ERW      0       5
.
.
.
.

此数据表明审计员是否在过去五年内更换。如果有开关,则更改值为“1”。我要计算

1) 去年切换的公司百分比(计数=1)。

2) 在过去五年中没有转换的公司的百分比(变化=0,计数=1、2、3、4、5)。

3) 五年内经历多次变化的公司百分比(变化 = 1 表示计数 = 不止一次)

我只想知道怎么做的逻辑。

【问题讨论】:

    标签: r dplyr


    【解决方案1】:

    我可能会使用 dplyr 对更改列求和:

    changeSummary <- yourData %>%
      group_by(company) %>%
      summarise(sumChanges = sum(change))
    

    这将给出每家公司列出一次的数据框以及每家公司的变化计数。然后,您可以轻松地为上述 3 个标准中的任何一个提取百分比。例如。你的第一个场景(count == 1):

    answer1 = length(filter(changeSummary, sumChanges == 1)) / length(sumChanges)
    

    【讨论】:

      猜你喜欢
      • 2018-07-22
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多