【发布时间】:2012-07-09 06:19:32
【问题描述】:
我有一个大约 500,000 行的数据框。其中一列包含正整数值,例如 A 列。假设有另一列 B
我现在需要创建第二个数据帧,其行数等于 sum(dataframe$A)。这已经完成了。
当我需要用数据填充这个新数据框时,就会出现性能问题。我正在尝试为第二帧创建 A2 列,如下所示:
A2<-vector()
for (i in 1:nrow(dataframe)){
A2<-c(A2,rep(dataframe$B[i],dataframe$A[i]))
}
对于正在处理的大量行,外部循环显然非常慢。有关如何以更快的处理速度完成此任务的任何建议。
感谢回复
【问题讨论】: