【发布时间】:2015-05-05 18:48:44
【问题描述】:
我想根据 var_1 的值了解每列的唯一值总数。
例如:
Test <- data.frame(var_1 = c("a","a","a", "b", "b", "c", "c", "c", "c", "c"), var_2 = c("bl","bf","bl", "bl","bf","bl","bl","bf","bc", "bg" ), var_3 = c("cf","cf","eg", "cf","cf","eg","cf","dr","eg","fg"))
我正在寻找的结果将基于 var_1 中的值,应该是:
var_1 var_2 var_3
a 2 2
b 2 1
c 3 4
但是,在尝试了各种方法(包括应用和表)之后 - 聚合一直是最接近我正在寻找的东西,但是此脚本会汇总 var_1 的每个值的条目总数,但是总计不是唯一的
agbyv1= aggregate(. ~ var_1, Test, length)
var_1 var_2 var_3
a 3 3
b 2 2
c 5 5
我试过了
unqbyv1= aggregate(. ~ var_1, Test, length(unique(x)))
但这没有用。
非常感谢任何帮助。
【问题讨论】:
-
您的第二个
aggregate方法几乎是正确的!