【问题标题】:Numerical frequency counts in RR中的数字频率计数
【发布时间】:2015-11-16 20:24:38
【问题描述】:
我有一个大型数据框(100 列和约 250,000 个观察值),我试图同时获取每个变量的数值和 NA 的频率计数。我曾尝试使用table,但数据对于该功能来说太大了。有关如何获得这些计数的任何建议?数据仅包含 NA 和数字 1 到 5,因此例如数据的一小部分是:
i1 i2 i3 i4 i5 i6 i7 i8
5 4 3 NA 3 4 3 NA
4 3 2 5 4 3 5 NA
谢谢!
【问题讨论】:
标签:
r
dataframe
frequency
【解决方案1】:
我创建了一个包含 5 列和 250,000 行的数据框,每列都是从向量 c(1:5,NA) 中抽取的样本。像这样使用 apply 函数没有问题:
new_df <- apply(df,2,table)
我假设您希望按列分解频率。如果您真的想要整个数据帧的频率,您可以对列执行上述应用函数,然后使用另一个应用函数对行求和,如下所示:
apply(new_df,1,sum)
我的结果是这样的
1 2 3 4 5
167025 166677 166471 166849 166541