【发布时间】:2013-03-20 22:08:09
【问题描述】:
我的问题源于this 和this 之前提出的问题,并且我认为与他们完全不同。想象一下,我有一个最小的数据集(鸟类),其中每一行代表在给定时间和地点对鸟类的观察,如下所示:
id,obs,country
A,4,USA
B,3,CAN
A,5,USA
C,4,MEX
C,1,USA
A,3,CAN
D,1,null
理想情况下,我想要的是将此数据集转换为这样的形式,从数据集中删除空值:
id,tot_obs,country_tot
A,12,2
B,3,1
C,5,2
我知道我可以使用以下方法计算因子数:
table(bird$country)
但是,有没有一种更聪明的方法,也许是一种去除空值、将总计数相加、找到国家的计数然后将它们重新配置为这种形式的方法?如果有一个包可以做到这一点,那么我也愿意接受这个建议。谢谢!
【问题讨论】:
-
第一行的
tot_obs不应该是12吗? -
道歉。这是一个错字。我现在已经编辑了。
-
Shion,是的,在那种情况下,下面的答案应该可以做到。
标签: r dataframe multiple-columns