【问题标题】:R: Quickest way to summarize number of observations for multiple variablesR:总结多个变量的观察次数的最快方法
【发布时间】:2015-07-20 15:37:28
【问题描述】:

我确信这是一件超级简单的事情,但我找不到真正快速简便的解决方案。

我有很多列格式如下的患者数据:

patID   disease   category ...
1       1          A
2       0          B
3       1          C
4       1          B

如何快速生成汇总表,其中包含数据框中每列/变量的观察次数?结果应该是这样的:

VARIABLE     Number of rows
disease:1    3
disease:0    1
category:A   1
category:B   2
category:C   1
...

我知道我可以通过使用 table(data$column) 对单个变量执行此操作。但是我怎样才能为数据框中的所有列生成类似的东西呢?

【问题讨论】:

    标签: r dplyr summary


    【解决方案1】:

    使用tidyrdplyr

    gather(data, variable, value, -patID) %>%
      count(variable, value)
    

    (感谢@Frank 提醒我有关tallycount。)

    【讨论】:

    • summarise(n()) 有一个快捷方式:tally。还有count 可以避免对group_by 的需要(抱歉编辑评论;看了文档后才想起后者)
    猜你喜欢
    • 2013-12-03
    • 2019-07-15
    • 2019-07-19
    • 1970-01-01
    • 1970-01-01
    • 2021-06-27
    • 1970-01-01
    • 1970-01-01
    • 2018-07-01
    相关资源
    最近更新 更多