【问题标题】:Numerical frequency counts in RR中的数字频率计数
【发布时间】:2015-11-16 20:24:38
【问题描述】:

我有一个大型数据框(100 列和约 250,000 个观察值),我试图同时获取每个变量的数值和 NA 的频率计数。我曾尝试使用table,但数据对于该功能来说太大了。有关如何获得这些计数的任何建议?数据仅包含 NA 和数字 1 到 5,因此例如数据的一小部分是:

i1 i2 i3 i4 i5 i6 i7 i8
5  4  3  NA 3  4  3  NA
4  3  2  5  4  3  5  NA

谢谢!

【问题讨论】:

    标签: r dataframe frequency


    【解决方案1】:

    我创建了一个包含 5 列和 250,000 行的数据框,每列都是从向量 c(1:5,NA) 中抽取的样本。像这样使用 apply 函数没有问题:

    new_df <- apply(df,2,table)
    

    我假设您希望按列分解频率。如果您真的想要整个数据帧的频率,您可以对列执行上述应用函数,然后使用另一个应用函数对行求和,如下所示:

    apply(new_df,1,sum)
    

    我的结果是这样的

         1      2      3      4      5 
    167025 166677 166471 166849 166541 
    

    【讨论】:

    • 别忘了useNA='always'
    • 感谢工作完美,虽然我只需要第一部分!
    猜你喜欢
    • 2020-06-30
    • 1970-01-01
    • 1970-01-01
    • 2013-09-24
    • 2012-06-08
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多