【发布时间】:2013-12-10 03:12:10
【问题描述】:
我想计算 R 数据框中每个由另一个字段分组的特定字段的有效条目(数值)的数量,在本例中为“公司”。
Company <- rep(c('A','B','C'),3)
Dates <- c(rep('20130131',3),rep('20130228',3),rep('20130331',3))
F1 <- c(1:3,NA,NA,6:9)
F2 <- c(21:27,NA,NA)
F3 <- c(31:39)
F4 <- c(NA,NA,NA,44:48,NA)
df <- data.frame(Company, Dates, F1, F2, F3, F4)
生成的data.frame
> df
Company Dates F1 F2 F3 F4
1 A 20130131 1 21 31 NA
2 B 20130131 2 22 32 NA
3 C 20130131 3 23 33 NA
4 A 20130228 NA 24 34 44
5 B 20130228 NA 25 35 45
6 C 20130228 6 26 36 46
7 A 20130331 7 27 37 47
8 B 20130331 8 NA 38 48
9 C 20130331 9 NA 39 NA
然后我想知道每个“公司”和每个字段有多少日期具有有效(数字)值。 输出看起来像
Company F1 F2 F3 F4
A 2 3 3 2
B 2 2 3 2
C 3 2 3 1
我正在处理的数据框将包含大约 500 家公司、365 个日期和 45 个字段,因此手动操作并不是一个真正的选择。
任何想法将不胜感激。
谢谢,
【问题讨论】: