【问题标题】:Summing by Categorical Variable按分类变量求和
【发布时间】:2009-11-02 20:37:27
【问题描述】:

我有一个按销量计算的漫画书销量数据集(例如火影忍者 v10),我需要将其减少为按系列销量(因此所有火影忍者销量销量将被加在一起成为一个观察值)。我有一个变量“系列”,用于标识每个观察的系列。 Stata 中的等效代码是:

by series, sort:replace unitssales=sum(unitssales);
by series, sort:keep if _n==_N

但我正试图弄清楚如何在 R 中做到这一点。任何帮助将不胜感激!提前致谢!

【问题讨论】:

标签: r statistics stata


【解决方案1】:

在不知道你的数据是什么格式的情况下,我只能建议你看看tapply 函数。来自帮助:

> n <- 17; fac <- factor(rep(1:3, length = n), levels = 1:5)
> tapply(1:n, fac, sum)
 1  2  3  4  5 
51 57 45 NA NA 

【讨论】:

    猜你喜欢
    • 2017-02-14
    • 2019-10-07
    • 2017-10-21
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-02-11
    相关资源
    最近更新 更多