【发布时间】:2021-02-04 04:44:31
【问题描述】:
当我想总结数据集中的分类变量时,我经常遇到困难。我的数据集包含每位患者的二分变量(是/否)。在下面的示例集中,“A-C”是该人有或没有的风险因素。
A <- c("yes", "no", "yes", "no", "yes")
B <- c("no", "no", "yes", "yes", "no")
C <- c("yes", "no", "yes", "no", "yes")
df <- data.frame(A, B, C)
我要做的是将所有变量汇总为因子水平计数和百分比 - 使用一行代码。我尝试使用 apply、forcats、dplyr 但无法正确使用。谁能帮帮我:)
我希望得到:
一个: 是 3 | %
没有 2 | %
乙:..
C..
最终目标是制作一个包含连续变量和分类变量的研究人群基线特征的大汇总表。可能会尝试使用 CBCgrps 或 tableone。
谢谢!
【问题讨论】:
-
您能以您需要的格式发布您的预期输出吗?
-
下面所有三个答案都得到了预期的输出:)
-
是的,但格式不同:)
标签: r dplyr categorical-data baseline