【发布时间】:2014-12-10 01:41:24
【问题描述】:
我的数据框包含一段时间内许多人的信息。新个体在出现时被添加到数据框中。
我想在一段时间内对我的数据框进行子集化,以便只出现新的个人。 例如。 2000-2012 年的数据框架。 2008-2012 年的子集,仅包括出现在 2008-2012 年但不包括 2000-2008 年的个人
更多信息:
我的数据集看起来有点像这样
数据
id date score
43 2006 15
12 2011 15
12 2007 16
14 2011 17
14 2011 14
14 2012 14
我想进行子集化,以便仅包含 2008 年之后首次出现的 id。 即在上面的例子中,只有 id=14 会被包括在内,因为所有分数都发生在 2008 年之后。id=12 不会被包括在内,因为一个分数发生在 2008 年之前
【问题讨论】:
-
请展示一个小的示例数据集以更好地理解问题。
-
您是指出现在
2008-2012而不是2000-2007的个人吗? -
是的,出现在 2008-2012 但不是 2000-2007 的个人
-
我的代码适用于您展示的示例。请在我的帖子中查看
Update2。