【发布时间】:2012-09-14 08:10:47
【问题描述】:
对于从如下所示的 SQL 查询填充的数据框:
Company Month Total_Count
ABC 2012-03 10
ABC 2009-01 1
DEF 2011-01 29
GHI 2001-09 10
GHI 2008-01 9
GHI 2010-09 100
我想出一份总结报告,输出如下:
Company Total Months
ABC 11 10 1
DEF 29 29
GHI 119 10 9 100
Total 列将是所有月份的总和
和列Months 将是该组织遇到的每个月的个人计数。我很想看看是否有可能以某种方式挤进实际的月份。比如:
Company Total Months
2009-01 2012-03
ABC 11 10 1
2011-01
DEF 29 29
2001-09 2008-01 2010-09
GHI 119 10 9 100
到目前为止,我只能通过以下方式获得上述所需结果的前 2 列:
df1 <- ddply(resultSet, .(company_name), summarize, sum(as.numeric(total_count)))
但我不确定如何附加个别月份的信息
【问题讨论】:
-
这些可能不是 R 中的日期或日期时间列。您可能正在聚合“因子”或“字符”分类变量。