【发布时间】:2020-09-01 05:06:50
【问题描述】:
我想按 ID 对我的 data.table 进行分组,并删除所有 count 确实不多年来具有相同值的组。
也许如果 ID 和计数组合不是唯一的,则删除所有具有该 ID 的行?
我正在寻找适合大型data.table的解决方案
数据:
# example data
ID <- c(rep("A", 5), rep("B", 6), rep("C", 2), rep("D", 3), rep("E", 4))
count <- c(rep(3, 5), rep(4, 6), rep(1, 2), c(1,3,3), rep(1, 4))
year <- as.numeric(c(rep(c(2012, 2013, 2014, 2015), 4), 2012, 2013, 2015, 2016))
mydata <- cbind(ID, year, count)
mydata <- as.data.table(mydata)
mydata <- setorder(unique(mydata))
【问题讨论】:
标签: r count duplicates data.table unique