【发布时间】:2018-12-11 09:04:20
【问题描述】:
我的 R 脚本格式如下:
for (j in 1:N) {
#construct the DF2 data frame
#operations on the DF2 data frame
}
其中 N 可以很大(例如 100 万)。定义了 DF2 的列 一个接一个的用公式:
DF2$column_i <- function(x,f..) #or constant or ....
DF$column_i 可以是常量、函数或循环“while”。我尝试使用以下方法预先分配定义 DF2:
DF2 <- data.frame(matrix(nrow=..,ncol=..))
在DF2$column_i 列之后进行计算,但我没有任何好处。
有人有什么想法吗?
【问题讨论】:
-
如果您可以提供您正在计算的确切公式/代码,这可能会更容易。也许你根本不需要循环......
-
在 R 中优化循环的最佳方法是避免它。如果您必须/想要使用循环,我宁愿使用
foreach() %dopar%,尤其是用于构建 df/matricies -
我的代码在我的回答中。
标签: r for-loop dataframe optimization