【发布时间】:2020-01-05 15:54:33
【问题描述】:
我正在尝试过滤深度数据和相应日期的数据集。
Time 列是一个 POSIXct format = "%Y%m%d%H%M%S"。
这就是我的数据的样子:
Depth Time
0.1 2018-06-24 01:26:40
0.2 2018-06-24 01:26:41
0.2 2018-06-24 01:26:56
0.1 2018-06-24 01:26:57
0.1 2018-06-24 01:26:58
0.1 2018-06-24 01:26:59
0.1 2018-06-24 01:27:14
0.1 2018-06-24 01:27:15
0.1 2018-06-24 01:27:16
0.1 2018-06-24 01:27:17
0.1 2018-06-24 01:27:30
我想创建一个包含相同数据的数据框,但每 15 秒只有一个新条目。我的数据有时是连续的,有时记录的时间有间隙。
这将是我想要的输出:
深度时间
0.2 2018-06-24 01:26:41
0.2 2018-06-24 01:26:56
0.1 2018-06-24 01:27:14
0.1 2018-06-24 01:27:30
我尝试使用适用于连续数据集部分的行之间的时间差:
dt_filter <- d_cor %>%
mutate(diff = Time - lag(Time, default = first(Time)))
if ((dt_filter$diff < 2) ) {
dt_filter_1 <- dt_filter[seq(1, nrow(dt_filter), 15), ]
}
但是,一旦我尝试添加不连续的那些,就会给我一个问题:
dt_filter_15 <- dt_filter %>%
filter(diff >= 15 )
从那以后,我不再有 15 秒的间隔,而且显然没有将它们计算在内。
到目前为止,我找不到能够过滤我的时间列的函数。我对 R 很陌生,所以不太熟悉编写自己的循环,我认为这是必要的......而且时间数据并没有让它变得更容易。
感谢您的帮助!
编辑
@Ben 感谢您的快速回复!
这是我得到的一些输出:
Depth Time diff cumdiff x
0.1 2018-06-23 23:59:44 1 1030 0
0.0 2018-06-24 00:01:02 78 1035 5
0.0 2018-06-24 00:01:03 1 1036 1
最后两行之间只有1s的差异,但是还是加到了cumdiff,所以算在x列里
【问题讨论】:
-
对 diff 的 cumsum 进行模除。
-
你好,如果你能提供一个可复制的代码就好了(你可以使用
dput作为你的示例数据集)。因为没有人愿意手动复制您提供的所有数据..
标签: r time filter sequence intervals