【问题标题】:How to find unused factor levels?如何找到未使用的因子水平?
【发布时间】:2015-05-04 07:22:00
【问题描述】:

我有带有“州”列的数据框,这是美国州的一个因素。

并非所有状态都存在于值之间,而所有状态都存在于因子水平之间。

如何找到数据框中从未使用过的因子水平?

【问题讨论】:

  • 如果您查看因子变量,所有级别都会被打印出来
  • 如何以编程方式使用这个事实?

标签: r enums r-factor


【解决方案1】:

试试:

# A toy factor variable:
f <- factor(letters[1:2], levels = letters[1:4])
f
[1] a b
Levels: a b c d
levels(f)
[1] "a" "b" "c" "d"

查看未使用的关卡:

setdiff(levels(f), f)
[1] "c" "d"

【讨论】:

  • 这很好。对长向量执行setdiff(levels(f), unique(f)) 可能更有效吗?
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2016-04-16
  • 2017-10-20
  • 2014-07-08
相关资源
最近更新 更多