【发布时间】:2020-11-05 21:47:50
【问题描述】:
我有一个包含 2500 万行的文件,需要根据因子级别将其拆分为较小的文件。我创建了一个包含不同因子级别的数据框,并编写了一个循环来执行一些操作并写出csv。
数据如下所示:
Country Col2 Code Year
A C 1 2020
A D 1 2020
A C 1 2020
A D 2 2020
A C 2 2020
A D 2 2020
A C 2 2020
A D 3 2020
意图是根据代码为每个子集编写一个csv文件
d1 <- data %>%
distinct(Code)
for(i in 1:nrow(d1))
{
subset <- data %>%
filter(Code == Code[i])
co <- subset$Code[i]
yr<- subset$Year[i]
setwd("C:/Users/...")
write.csv(subset, paste(co,"_",Year, ".csv", sep=""), append = FALSE, row.names = FALSE)
}
输出不断被写入同一个文件,而不是在目录中创建单独的文件。
有没有更好的方法来做到这一点?谢谢。
【问题讨论】: