【发布时间】:2020-06-12 17:50:48
【问题描述】:
我有一个长格式的数据框,每个参与者有 90 行。现在我想排除在某些特定列中具有超过 10 个 NA 的每个参与者。例如,如果在称为 rating1 的列中有超过 10 个 NA,或者在 rating 2 中有超过 10 个 NA。
我认为我必须使用 for 循环来解决这个问题。但我不知道怎么做。所以我想检查前 90 行并检查是否有超过 10 个 NA,然后检查接下来的 90 行等等,并将这些案例的 id 保存在某处,以便我可以排除它们。 是否清楚我要达到的目标?
我试过了,至少得到了前 90 个的总和
colSums(is.na(dato[1:90,]))
【问题讨论】:
-
您能否澄清一下您要根据一个特定列或许多列中的任何一列中的 10 个
NAs 排除?