【发布时间】:2018-03-28 10:36:40
【问题描述】:
请运行下面的 R 代码,我希望使用下面的数据获得一个数据集,其中“品牌”和“糖果”列值出现一次,相应的时间值是所有此类情况的总和。为了说明,我希望前两个值“Mars”和“A”只出现一次,它们的总和“22”出现在下一列中。其余的类似,该命令也应该快速处理大数据。谢谢,请帮忙。
PlanetData <- read.table(
text = "
Brand Candy time
Mars A 10
Mars A 12
Jupiter B 13
Jupiter B 14
Saturn C 21
Saturn C 26",
header = TRUE,
stringsAsFactors = FALSE)
【问题讨论】:
-
aggregate(PlanetData$time, list(PlanetData$Brand, PlanetData$Candy), sum) -
@LAP,感谢您的帮助。但是,该命令会在大数据上快速运行吗?
-
你试试@RobertJ,如果没有,你会学习并行编程:-)
-
您的数据有多大? 50k 行还是 3000 万行?
-
@LAP,可能以百万计