【发布时间】:2012-06-28 08:19:32
【问题描述】:
如何子集以下示例数据框以仅返回一个 最早出现的观察[即每个 id 的 min(year)]?
id <- c("A", "A", "C", "D", "E", "F")
year <- c(2000, 2001, 2001, 2002, 2003, 2004)
qty <- c(100, 300, 100, 200, 100, 500)
df=data.frame(year, qty, id)
在上面的示例中,“A”id 在 2000 年和 2001 年有两个观察结果。在重复 id 的情况下,我希望子集数据框仅包含第一次出现(即 2000 年)重复 id 的观察结果。
df2 = subset(df, ???)
这是我想要返回的:
df2
year qty id
2000 100 A
2001 100 C
2002 200 D
2003 100 E
2004 500 F
任何帮助将不胜感激。
【问题讨论】:
标签: r dataframe subset plyr data.table