【发布时间】:2017-07-16 14:47:16
【问题描述】:
我有一些网络会话数据,我试图在上次访问过去一段时间(比如说 10 天)后排除所有观察结果。我有一个 ID、一个 VisitNum 和一个计算的 DateDiff,表示自上次访问以来经过的天数。我的 ID 是因素,因此我需要解决方案来处理多个因素水平。
样本数据:
test_data <- data.frame(ID=c("abc123","abc123","abc123","abc123"),
VisitNum=c(1,2,3,4),
DateDiff=c(0,5,30,5))
由于第 3 次访问发生在第 2 次访问后 30 天,我想从数据框中排除第 3 次和第 4 次访问。我提出的解决方案将排除第 3 次访问,但保留第 4 次访问 - 这不是我需要的。
我想要的结果是这样的:
test_results <- data.frame(ID=c("abc123","abc123"),
VisitNum=c(1,2),
DateDiff=c(0,5))
谢谢!
【问题讨论】:
-
关于如何在 R 中编码/操作数据的问题不在此处讨论。这将在Stack Overflow 上讨论。如果您等待,我们将尝试为您迁移。
-
谢谢@gung,很抱歉我已经有一段时间没有使用这些论坛了。
标签: r time-series subset date-arithmetic