【发布时间】:2019-02-07 00:07:47
【问题描述】:
我有一个包含 POSIXct 日期时间 (t1) 数据的数据表,该数据按多列分组。我的数据应该有 48 行,每个组每隔半小时(总共 24 小时),其日期时间 (t1) 值由用作分组变量一部分的另一个日期时间 (t2) 变量确定。 48 行 (t1) 数据应该是 24 小时的半小时间隔,直到分组的日期时间 (t2)。
我需要用每个组的上一个(按时间顺序)完整数据行中的值填充缺失的行。
例如:如果按ID分组的数据=A,datetime(t2)=10-01-2019 06:00:00(格式='dd-mm-yyyy hh:mm: ss') 具有从 09-01-2019 08:00:00 到 10-01-2019 04:00:00 的日期时间 (t1) 数据。它应该从 09-01-2019 06:00:00 到 10-01-2019 05:30:00,这意味着 4 行数据(2 小时)是从一开始就缺失,从结尾缺失 3 行数据,并且在可用数据点之间也缺失了几行。虽然无法用完整数据填充在时间段开始时丢失的行,但我仍然希望将这些行作为 NA 添加到表中。但是,使用前一个完整数据行中的完整数据填充表末尾的行非常重要。
我的数据集示例如下所示:(按 ID 和 t2 分组)
ID t2 t1 varX varY
...
A 10-01-2019 06:00:00 10-01-2019 12:00:00 100 Y1
A 10-01-2019 06:00:00 10-01-2019 12:30:00 60 Y2
B 10-01-2019 06:00:00 10-01-2019 01:00:00 100 Y2
A 10-01-2019 06:30:00 10-01-2019 01:30:00 100 Y3
B 10-01-2019 06:30:00 10-01-2019 02:00:00 200 Y4
C 10-01-2019 07:00:00 10-01-2019 04:00:00 100 Y3
【问题讨论】:
标签: r datetime data.table grouping padding