【发布时间】:2015-09-17 19:59:43
【问题描述】:
因此,我导入了一个包含 178 个观测值和 8 个变量的数据集。然后最终目标是消除其中三个变量(2、5 和 6)中相同的所有观察值。事实证明,使用独特的命令非常容易。
mav2 <- unique(mav[,c(2,5,6)])
生成的mav2 数据框产生了 55 个观察值,消除了所有重复!不幸的是,它还去掉了我在唯一命令中没有使用的其他五个变量(1、3、4、7 和 8)。我最初尝试添加两个数据框,当然这不起作用,因为它们的大小不等。我也尝试过将两者合并,但这失败了,只是给出了第一个数据集的输出,其中包含所有 178 个观察值。
第二个数据集 (mav2) 确实生成了一个新列 (row.names),它是初始数据集中每个观察值的行号。
如果有人可以帮助我将所有 8 个初始变量放入只有 55 个独特观察值的数据集中,我将不胜感激。提前致谢。
【问题讨论】:
-
如果您使用
data.table,则unique函数有一个by参数。 -
您能提供一个样本
mav数据集吗?这使您的问题更具重现性:stackoverflow.com/questions/5963269/… -
很遗憾,我无法分享实际数据
标签: r variables duplicates