【问题标题】:Subsetting a dataframe with Missing Factors使用缺失因子对数据框进行子集化
【发布时间】:2017-04-25 02:20:30
【问题描述】:

我有一个因子缺少大约 13,000 个级别(我的因子中大约有 13,00 个缺失值/NA)。如何对数据进行子集化以仅包含缺少级别的特定列?

  dat$xyz <- as.factor(dat$xyz)
  subsetdf <- dat[which(dat$xyz == "NA"),]

这将返回一个新的数据框,其中包含所有原始变量且观测值为零。任何帮助将不胜感激!

谢谢。

【问题讨论】:

  • 试试这个:subsetdf
  • 不客气。 “NA”不等于“NA”是R的一个奇怪之处......

标签: r


【解决方案1】:

感谢 Sconfluentus

  subsetdf <- dat[which(is.na(dat$xyz),]

【讨论】:

    【解决方案2】:

    仅供参考,您不需要which(),因为is.na() 返回一个布尔向量。 which 将布尔值转换为 TRUE 值的位置向量。

    试试subsetdf &lt;- dat[is.na(dat$xyz),]

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2017-11-09
      • 1970-01-01
      • 2023-03-22
      • 1970-01-01
      • 1970-01-01
      • 2013-08-15
      • 2020-10-03
      • 2022-01-17
      相关资源
      最近更新 更多