【发布时间】:2020-12-19 03:57:18
【问题描述】:
我需要为我的数据集 ds 运行一个循环。 ds的亮度是4000,11。代表世界的每个国家。每个国家都有 1970 年到 1999 年的数据。
数据集的 8 行中有缺失数据。我需要运行一个循环来计算每年有多少丢失的数据。年份以 df$year 为单位。
我很确定年份(1970、1971、1972...)是数值。
这是我当前的代码
missingds<-c()
for (i in 1:length(ds)){
missingds[names(ds)[i]]<-sum(is.na(ds[i]))/4000
}
这给了我每个 ds 变量的缺失数据比例。我只是不知道如何让它报告每年所有变量的比例。
我确实有一个指示变量 ds$missing,如果该行的任何列中存在 NA,则报告 1,否则报告 0。
【问题讨论】: