【发布时间】:2015-05-04 07:22:00
【问题描述】:
我有带有“州”列的数据框,这是美国州的一个因素。
并非所有状态都存在于值之间,而所有状态都存在于因子水平之间。
如何找到数据框中从未使用过的因子水平?
【问题讨论】:
-
如果您查看因子变量,所有级别都会被打印出来
-
如何以编程方式使用这个事实?
我有带有“州”列的数据框,这是美国州的一个因素。
并非所有状态都存在于值之间,而所有状态都存在于因子水平之间。
如何找到数据框中从未使用过的因子水平?
【问题讨论】:
试试:
# A toy factor variable:
f <- factor(letters[1:2], levels = letters[1:4])
f
[1] a b
Levels: a b c d
levels(f)
[1] "a" "b" "c" "d"
查看未使用的关卡:
setdiff(levels(f), f)
[1] "c" "d"
【讨论】:
setdiff(levels(f), unique(f)) 可能更有效吗?