【发布时间】:2017-05-16 08:04:29
【问题描述】:
我有大量结构相同的 csv 文件。 这些文件中的每一个都有四列:A、B、C、D。 B 和 C 列有一定的数据。 D列有每个文件的ID。 我必须计算用户选择的每个文件中 B 列和 C 列中具有有效(即非“NA”)值的行数。 目标结果是一个包含 ID 和计数的两列数据框。 我已经开始写一个循环,但我卡住了......有人可以帮我吗?我对 R 很陌生。
path = "R:\\A\\data\\"
fileList = list.files(path)
file.names = as.numeric(sub("\\.csv$","",fileList))
selected.files = fileList[match(D,file.names)]
n=length(selected.files)
for (i in 1:n) {
Data<-read.csv(paste(path,selected.files[i], sep=""))
count1<-length(which(Data[i]$B!="NA"&Data[i]$C!="NA"))
}
result<-c(id, count1)
result
【问题讨论】: