【发布时间】:2017-04-25 02:20:30
【问题描述】:
我有一个因子缺少大约 13,000 个级别(我的因子中大约有 13,00 个缺失值/NA)。如何对数据进行子集化以仅包含缺少级别的特定列?
dat$xyz <- as.factor(dat$xyz)
subsetdf <- dat[which(dat$xyz == "NA"),]
这将返回一个新的数据框,其中包含所有原始变量且观测值为零。任何帮助将不胜感激!
谢谢。
【问题讨论】:
-
试试这个:subsetdf
-
不客气。 “NA”不等于“NA”是R的一个奇怪之处......
标签: r