【发布时间】:2021-08-12 11:44:23
【问题描述】:
我有很多文件要处理。数据如下:
V2 V3 V4
1 ID_0071817 1 1
2 1 201912312200+00 0.36
3 2 201912312300+00 0.36
4 3 202001010000+00 0.38
5 ID_0089011 1 1.00
6 1 202001010200+00 0.36
我现在要做的是:
for(j in 1:nrow(data)) { if (data[j,2] == "1") {ID<-data[j,1]}
data[j,4] <- ID
}
产生:
V2 V3 V4 V4.1
1 ID_0071817 1 1 ID_0071817
2 1 201912312200+00 0.36 ID_0071817
3 2 201912312300+00 0.36 ID_0071817
4 3 202001010000+00 0.38 ID_0071817
5 ID_0089011 1 1.00 ID_0089011
6 1 202001010200+00 0.36 ID_0089011
问题是这种处理整个数据的方式太慢了。单个文件大约需要 5 分钟,我得到了几千个。
【问题讨论】:
-
请添加语言标签 - 是
R吗?
标签: r performance loops for-loop